1. 昨年度提案した流行のライフサイクル方程式のシステマティックなパラメータ推定方法を構築した。昨年度までは、グリッドサーチによって与えられた範囲からパラメータを推定していたが、時系列の上昇・減衰速度や最大値などを用いて効率的に推定する方法を構築した。これによって、パラメータ推定にかかる時間が大幅に短縮された。
2. 大規模なブログデータセットから日々の単語の出現頻度を観測すると、定常的な振る舞いをする「日常語」、指数関数的な上昇後、下降する「流行語」、ニュース時に急激に上昇し、その後、べき関数で減衰する「ニュース語」、バレンタインデーなどある特定日に向けてべき関数に従って上昇し、その後べき関数で減衰する「季節語」という4つの代表的なクラスが存在する。国語事典の単語やWikipediaの見出し語など、様々な単語の出現頻度の時系列に対して上記の4つのクラスに「その他」を加えた5クラスへ分類するアルゴリズムの基礎を構築した。このアルゴリズムはデマの早期発見などに活用が可能である。
|