2011 Fiscal Year Annual Research Report
ディリクレ過程混合ARMAモデルによる時系列クラスタリング
Project/Area Number |
22500261
|
Research Institution | Hiroshima City University |
Principal Investigator |
末松 伸朗 広島市立大学, 情報科学研究科, 准教授 (70264942)
|
Keywords | ディリクレ過程 / ディリクレ過程混合モデル / マルコフ連鎖モンテカルロ法 / ARMAモデル / 時系列クラスタリング / 自然共役事前分布 |
Research Abstract |
ARMAモデルを要素モデルとするディリクレ過程混合(DPM)モデルを用いた時系列クラスタリングを実現し,その特性を調べて改善策を検討している. DPMモデルを使ったデータ解析では,マルコフ連鎖モンテカルロ(MCMC)法によって事後分布に従うパラメータのサンプルを生成するが,要素モデルがARMAモデルという,パラメータの自然共役事前分布が存在しないモデルであるため問題が生じる.昨年度は,この問題を回避するための,非常にシンプルな新しい方法を提案した.しかし,一部の実データにおいて,予想される程度を越える多数の細かいクラスタに分けられるという問題が見つかった. この問題は,DPMモデルの集中度パラメータの事前分布に変更を加えることで改善されるとの予想のもと検討を行ったが,これまでのところ十分な改善が実現できていない.実データについては,当然ながら,真の要素ARMAモデルは存在しておらず,混合ARMAモデルとはあくまでも近似を行っているに過ぎない.過剰に細分化されたクラスタリングが避けられないのは,使用している実データが混合ARMAモデルによる近似にそぐわない可能性がある.これまでも,その実データの動的性質について調査はしており,混合ARMAモデルによる近似が十分可能であるという見通しを持っていたが,これまでの結果を踏まえると,この点についても再び検討を行う必要があると思われる. 一方,より優れたMCMCアルゴリズムとするために,昨年度実現したものと異なる方法で,非共役性の問題へ対処する方法についても検討を行っているが,まだ現代会では明確な成果は得られていない.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
合成データについては非常に有望な結果が得られていたが,実データにおいてクラスタの数が,想定されるものよりも非常に多数となる傾向が出ていて,この問題が解決できていないため当初の計画に対して遅れが生じている.
|
Strategy for Future Research Activity |
実データについて,合成データの場合と異なる振る舞いをする原因を調べ,対策を行うのが今後の最優先課題となる. また,昨年度提案した単純なサンプリング法に代わる,やや複雑にはなってしまうが,モデルに関する事前知識等を利用する事でより効率化した方法について検討を行う.
|
Research Products
(2 results)