研究課題/領域番号 |
23240019
|
研究機関 | 東京大学 |
研究代表者 |
山西 健司 東京大学, 情報理工学(系)研究科, 教授 (90549180)
|
研究分担者 |
冨岡 亮太 東京大学, 情報理工学(系)研究科, 助教 (70518282)
鹿島 久嗣 東京大学, 情報理工学(系)研究科, 准教授 (80545583)
|
研究期間 (年度) |
2011-04-01 – 2016-03-31
|
キーワード | 潜在的ダイナミックス / 機械学習 / データマイニング / モデル選択 / 異常検知 / 潜在変数モデル / 変化検知 / ネットワーク |
研究概要 |
潜在的ダイナミックスの情報論的学習理論の基盤部分を発展させ、応用実証を行った。 理論成果について:本研究の目的である、データからの潜在的構造のダイナミックスを学習を実現するために、本年は1)モデル推定基準の計算方法の広いモデルクラスへの拡張と2)オンライン環境への拡張と3)区間定常的情報源への拡張を行った。 とくに、1)では潜在的モデルの最適選択に必要な正規化最尤符号の計算方法を一般の指数分布族や潜在変数モデルに拡張して体系的な計算方法を確立した(IEEE Trans. Information Theory誌に投稿受理)。2)ではデータが逐次的に与えられる状況下で潜在的モデル構造の変化を捉えるためのアルゴリズムを開発した(ICDM2012で発表)。3)ではパラメータ離散化に基づく区間的定常情報源の変化検知アルゴリズムを開発した(ITW2012で発表)。以上をもって、潜在的ダイナミックスの情報論的学習理論の枠組みを昨年度に比べて大きく拡げ、その基盤を確立したといえる。 応用実証について:上記基礎理論をネットワーク構造変化検知に適用し、広告の効果測定における有効性を示した(ICDM2012で発表)。またTwitterデータからの新しい話題検知にも応用して有効性を実証した(IEEE Tran. Knowedge and Data Engineering誌に投稿受理)。さらに、教育試験データから潜在的なスキルを発見する問題に適用し、有効性を実証した(EDM2013に投稿受理)。また、上記理論をグラフ分割検知に応用して、人口移動データからのイベント検知やメール通信記録からの不正検知などに応用し、有効性を示した(KDD2013投稿)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究テーマについては、本年度は理論的基盤を拡大し、ビッグデータを対象とする応用実証例を増やすことを目標としていた。理論面ではモデル、オンライン環境、解析評価の点で理論的枠組が拡大し、応用実証面では、マーケティング、SNS,教育データなどを通じて実績が得られたので、概ね順調に進展しているといえる。
|
今後の研究の推進方策 |
本研究課題は、潜在的ダイナミックスという、広い情報現象を扱っており、今後はビッグデータを対象とした基礎理論の発展および実証事例の創出に注力していく必要があると考える。とくに、ビッグデータの抱える特性のうち、Variety(多様性)やVelocity(動的特性)に注目することで、関係データやヘテロデータなど、複雑なデータを対象にした潜在構造変化検知の問題に対する統一的理論を構築していく。また、その実証事例としては、これまで扱ってきたマーケティングやSNSデータだけではなく、医療や教育分野におけるビッグデータをも対象にして、適用範囲を拡げていく予定である。
|