2013 Fiscal Year Annual Research Report
Project/Area Number |
23240019
|
Research Institution | The University of Tokyo |
Principal Investigator |
山西 健司 東京大学, 情報理工学(系)研究科, 教授 (90549180)
|
Co-Investigator(Kenkyū-buntansha) |
冨岡 亮太 東京大学, 情報理工学(系)研究科, 助教 (70518282)
鹿島 久嗣 東京大学, 情報理工学(系)研究科, 准教授 (80545583)
|
Project Period (FY) |
2011-04-01 – 2016-03-31
|
Keywords | 潜在的ダイナミクス / 機械学習 / データマイニング / 情報論的学習理論 / 変化検知 / ビッグデータ |
Research Abstract |
本研究では、大量のデータからその背後にある潜在的な関係性やその動的な変化を読み解くための数理的手法を構築することを目的としている。H25年度は、以下の4項目の成果を得た。 1)潜在的ダイナミックス学習の基礎理論: ダイナミックで多様な時系列データから、潜在変数をもつ確率モデルを学習し、その構造変化を検知するアルゴリズムを開発した。具体的な潜在変数モデルとしては、ベイジアンネットワーク、木構造を有するグラフ分割構造、独立成分分析、一般関係性モデルなどを対象にした。これによって、データから複雑な構造をもった深い知識の変化をも検知することができるようになり、変化検知を従来より速く正確にできるようになった(例えば、グラフ分割変化検知では最大30%の精度を改善)。 2)潜在的異常検知への実適用: 上記理論をA)ソーシャルネットワークにおける話題検知、B)広告反応多次元時系列からの広告効果測定、C)試験データからの受講者スキル構造の変化検知 などに応用して、有効性を検証した。特に、C)では非負値行列分解によってスキルを抽出し、これをオンラインで実行するアルゴリズムを開発した。これにより、潜在的な教育効果を把握することが可能になった。 3)医療データマイニングへの応用: 緑内障進行予測問題を扱った。これは緑内障患者の視野の検査データから将来の視野を予測する問題である。個々の患者のデータの少なさが従来の問題であったが、時空間パタンのクラスタリング(潜在情報)に基づいて類似患者のデータを利用することにより、わずか3回以内の検査データのみで従来手法(個々の患者に対する線形予測)を60%上回る予測精度を実現した。 4)クラウドソーシングへの応用: オブジェクト間の潜在的な関係を予測する問題に対して、クラウドソーシングを用いてデータの品質のバラツキを抑えて正確な予測を行う方法を提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
潜在的ダイナミックスの基礎理論については、様々な潜在変数モデルに対する構造変化検知アルゴリズムの開発に成功し、学会発表、ジャーナル投稿も順調に進め、予定通りの瀬化を収めている。潜在的ダイナミックスの応用については、昨年度から継続していた広告効果測定、ソーシャルネットワーク分析に加え、緑内障進行予測や教育データ解析が新たに加わり、応用範囲を広げつつある。この意味で、当初の目的に沿って応用を深化させることができたとともに、新しい応用分野も開発しつつあるので、当初の計画以上の進展があったといえる。
|
Strategy for Future Research Activity |
今後は以下の2点を重点施策として取り組む。 1)潜在変数モデルの構造変化検知アルゴリズムの設計の拡大: これまで、クラスタリング構造やベイジアンネットワークといった潜在変数モデルを対象にした構造変化検知アルゴリズムを開発してきたが、今後は独立成分構造、制限付きボルツマンマシン、深層学習、非負値行列分解構造、一般関係モデル等にもアルゴリズムの範囲を拡張していく。これによってより複雑な潜在構造をもつ知識の変化をも検知でき、深い知識を読み取ることを可能とする技術を醸成していく。 2)「変化予測」への取り組み:これまでは構造変化を変化後に検知する技術を開発してきたが、構造変化を予測できる技術の開発に挑戦し、その理論基盤構築に取り組む。そのためには変化の予兆を数学的に定式化し、これを検知するためのアルゴリズムを開発する。 3)「潜在的関係性抽出」への取り組み:オブジェクト間の潜在的な関係を予測する問題に対する高精度で高効率な方法を確立し、これをネットワークの構造予測等に応用する。 4)応用対象の拡大: 潜在的ダイナミックスの応用対象として、これまで扱ってきた、ソーシャルネットワーク、マーケティング、医療、教育の分野において、より多くの多様でダイナミックなデータを対象にしながら、上記開発技術の実証を検証していく。特に、緑内障疾患を扱う問題に関しては、進行予測のみならず、眼圧データや病歴データなどをも含むヘテロデータからの疾患因子特定、疾患パタン特定などへと適用範囲を広げ、有効性を実証していく。
|
Research Products
(19 results)