2011 Fiscal Year Annual Research Report
Project/Area Number |
23240019
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | The University of Tokyo |
Principal Investigator |
山西 健司 東京大学, 大学院・情報理工学系研究科, 教授 (90549180)
|
Co-Investigator(Kenkyū-buntansha) |
鹿島 久嗣 東京大学, 大学院・情報理工学系研究科, 准教授 (80545583)
富岡 亮太 東京大学, 大学院・情報理工学系研究科, 助教 (70518282)
|
Keywords | 潜在的ダイナミックス / 機械学習 / データマイニング / モデル選択 / 異常検知 / 潜在変数モデル / 変化検知 / ネットワーク |
Research Abstract |
潜在的ダイナミックスの情報論的学習理論の基盤部分を構築し、応用実証を行った。 理論的成果について:本研究の目的である、データから潜存構造のダイナミックスの学習を実現するためには、モデル推定規準の構築と変化点検知アルゴリズムの設計が最も重である。そこで、本年度は、モデル推定基準として、記述長最小原理の下で「正規化最尤符号長」を提案し、ガウス混合分布やARモデルなど基本的なモデルに対して、その効率的な計算方法を与えた。また、潜在構造の変化検知アルゴリズムとして、逐次的な動的モテル選択アルゴリズムを幾つかのバリエーションに渡って設計した。いずれも潜変数モデルと呼ばれる普遍的な確率モデルの最適選択、並びにその構造変化検知に、効率かつオンラインで実装することができ、情報理論的保証に支えられた性能を有することを示した。これらのアルゴリズムが他のこれまで提案されてきたモデル選択アルゴリズムよりも高い推定精度や変化検知性能を有することを理論的、実験的に検証した。これによって、潜在的ダイナミックスを解明し、科学することの理論的基礎を一部構築し、重要なツールを開発することができた。 応用実証について:上記アルゴリズムを、セキュリティ分野への応用(攻撃検知)、マーケティング分野への応用(広告効果測定、購買行動分析)、ソーシャルネットワーク分析への応用(Twitterからの話題出現検知、Twitterからの長期存続話題の検知など)に展開し、それらの現実データでの有効性を検証した。 上記成果は、KDD2012, ICDM2011, PAKDD2011, ISIT2011といったデータマイニング及び情報理論の権威ある国際会議に受理され、発表を行うことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究テーマについては、初年度は理論的基盤をしっかりと固めることが目標であった。基本的なアルゴリズムが完成し、それらの有効性が理論的・実験的に検証できたので、概ね順調に進展しているといえる。
|
Strategy for Future Research Activity |
本研究課題は、潜在的ダイナミックスという、広い情報現象を扱っているので、さらなる基礎理論の構築が必要である。潜在的ダイナミックスの新しいモデルや、それらに対応する新しい構造変化検知アルゴリズムの設計と解析を継続して行っていく。また、これらの実適用先として、ビッグデータを対象にしていく。特に、ビッグデータの抱える3つの特性である(大量性、ヘテロ性、ダイナミック性)に対応した潜在的ダイナミックスの研究を行っていく。
|
Research Products
(14 results)