• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

潜在的ダイナミックスの情報論的学習理論の研究

研究課題

研究課題/領域番号 23240019
研究機関東京大学

研究代表者

山西 健司  東京大学, 情報理工学(系)研究科, 教授 (90549180)

研究分担者 冨岡 亮太  東京大学, 情報理工学(系)研究科, 助教 (70518282)
鹿島 久嗣  東京大学, 情報理工学(系)研究科, 准教授 (80545583)
研究期間 (年度) 2011-04-01 – 2016-03-31
キーワード潜在的ダイナミクス / 機械学習 / データマイニング / 情報論的学習理論 / 変化検知 / ビッグデータ
研究概要

本研究では、大量のデータからその背後にある潜在的な関係性やその動的な変化を読み解くための数理的手法を構築することを目的としている。H25年度は、以下の4項目の成果を得た。
1)潜在的ダイナミックス学習の基礎理論: ダイナミックで多様な時系列データから、潜在変数をもつ確率モデルを学習し、その構造変化を検知するアルゴリズムを開発した。具体的な潜在変数モデルとしては、ベイジアンネットワーク、木構造を有するグラフ分割構造、独立成分分析、一般関係性モデルなどを対象にした。これによって、データから複雑な構造をもった深い知識の変化をも検知することができるようになり、変化検知を従来より速く正確にできるようになった(例えば、グラフ分割変化検知では最大30%の精度を改善)。
2)潜在的異常検知への実適用: 上記理論をA)ソーシャルネットワークにおける話題検知、B)広告反応多次元時系列からの広告効果測定、C)試験データからの受講者スキル構造の変化検知 などに応用して、有効性を検証した。特に、C)では非負値行列分解によってスキルを抽出し、これをオンラインで実行するアルゴリズムを開発した。これにより、潜在的な教育効果を把握することが可能になった。
3)医療データマイニングへの応用: 緑内障進行予測問題を扱った。これは緑内障患者の視野の検査データから将来の視野を予測する問題である。個々の患者のデータの少なさが従来の問題であったが、時空間パタンのクラスタリング(潜在情報)に基づいて類似患者のデータを利用することにより、わずか3回以内の検査データのみで従来手法(個々の患者に対する線形予測)を60%上回る予測精度を実現した。
4)クラウドソーシングへの応用: オブジェクト間の潜在的な関係を予測する問題に対して、クラウドソーシングを用いてデータの品質のバラツキを抑えて正確な予測を行う方法を提案した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

潜在的ダイナミックスの基礎理論については、様々な潜在変数モデルに対する構造変化検知アルゴリズムの開発に成功し、学会発表、ジャーナル投稿も順調に進め、予定通りの瀬化を収めている。潜在的ダイナミックスの応用については、昨年度から継続していた広告効果測定、ソーシャルネットワーク分析に加え、緑内障進行予測や教育データ解析が新たに加わり、応用範囲を広げつつある。この意味で、当初の目的に沿って応用を深化させることができたとともに、新しい応用分野も開発しつつあるので、当初の計画以上の進展があったといえる。

今後の研究の推進方策

今後は以下の2点を重点施策として取り組む。
1)潜在変数モデルの構造変化検知アルゴリズムの設計の拡大: これまで、クラスタリング構造やベイジアンネットワークといった潜在変数モデルを対象にした構造変化検知アルゴリズムを開発してきたが、今後は独立成分構造、制限付きボルツマンマシン、深層学習、非負値行列分解構造、一般関係モデル等にもアルゴリズムの範囲を拡張していく。これによってより複雑な潜在構造をもつ知識の変化をも検知でき、深い知識を読み取ることを可能とする技術を醸成していく。
2)「変化予測」への取り組み:これまでは構造変化を変化後に検知する技術を開発してきたが、構造変化を予測できる技術の開発に挑戦し、その理論基盤構築に取り組む。そのためには変化の予兆を数学的に定式化し、これを検知するためのアルゴリズムを開発する。
3)「潜在的関係性抽出」への取り組み:オブジェクト間の潜在的な関係を予測する問題に対する高精度で高効率な方法を確立し、これをネットワークの構造予測等に応用する。
4)応用対象の拡大: 潜在的ダイナミックスの応用対象として、これまで扱ってきた、ソーシャルネットワーク、マーケティング、医療、教育の分野において、より多くの多様でダイナミックなデータを対象にしながら、上記開発技術の実証を検証していく。特に、緑内障疾患を扱う問題に関しては、進行予測のみならず、眼圧データや病歴データなどをも含むヘテロデータからの疾患因子特定、疾患パタン特定などへと適用範囲を広げ、有効性を実証していく。

  • 研究成果

    (19件)

すべて 2015 2014 2013 その他

すべて 雑誌論文 (4件) (うち謝辞記載あり 1件、 査読あり 2件) 学会発表 (12件) (うち招待講演 2件) 図書 (2件) 備考 (1件)

  • [雑誌論文] Sequential network change detection with its applications to ad impact relation analysis2015

    • 著者名/発表者名
      Yu.Hayashi and Kenji.Yamanishi:
    • 雑誌名

      Data Mining and Knowledge Discovery

      巻: 29 ページ: 137, 167

    • DOI

      10.1007/s10618-013-0338-6

    • 謝辞記載あり
  • [雑誌論文] Discovering emerging topics in social streams via link-anomaly detection2014

    • 著者名/発表者名
      Toshimitsu Takahashi, Ryota Tomioka, Kenji Yamanishi
    • 雑誌名

      IEEE Transactions on Knowledge and Data Engineering

      巻: Volume:26 , Issue: 1 ページ: 120 - 130

    • DOI

      10.1109/TKDE.2012.239

    • 査読あり
  • [雑誌論文] 特集「データを読み解く技術―ビッグデータ, eサイエンス, Latent Dynamics―」:潜在的ダイナミクスの学習理論2014

    • 著者名/発表者名
      山西健司
    • 雑誌名

      電子情報通信学会誌

      巻: Volume 97, No. 5 ページ: 422-- 426

  • [雑誌論文] Efficient computation of normalized maximum likelihood codes for Gaussian mixture models with its applications to clustering2013

    • 著者名/発表者名
      So Hirai, Kenji Yamanishi
    • 雑誌名

      IEEE Transactions on Information Theory

      巻: Volume:59 , Issue: 11 ページ: 7718 - 7727

    • DOI

      10.1109/TIT.2013.2276036

    • 査読あり
  • [学会発表] 潜在空間からのディープナレッジの発見2014

    • 著者名/発表者名
      山西健司
    • 学会等名
      暗号フロンティア研究会
    • 発表場所
      石川県能美市、北陸先端科学技術大学院大学
    • 年月日
      20140305-20140305
    • 招待講演
  • [学会発表] Learning an accurate entity resolution model from crowdsourced labels2014

    • 著者名/発表者名
      Jingjing Wang, Satoshi Oyama, Masahito Kurihara, Hisashi Kashima:
    • 学会等名
      The 8th International Conference on Ubiquitous Information Management and Communication
    • 発表場所
      Siem Reap, Cambodia, USA
    • 年月日
      20140109-20140110
  • [学会発表] Graph partitioning change detection using tree-based clustering2013

    • 著者名/発表者名
      Sho-ichi Sato, Kenji Yamanishi
    • 学会等名
      IEEE International Conference on Data Mining (ICDM2013)
    • 発表場所
      Dallas, USA
    • 年月日
      20131208-20131210
  • [学会発表] Quantitative prediction of glaucomatous visual field loss from few measurements2013

    • 著者名/発表者名
      Zenghan Liang, Ryota Tomioka, Hiorshi Murata, Ryo Asaoka, Kenji Yamanishi
    • 学会等名
      IEEE International Conference on Data Mining (ICDM2013)
    • 発表場所
      Dallas, USA
    • 年月日
      20131208-20131210
  • [学会発表] 潜在・観測変数間の非類似性の定量的評価2013

    • 著者名/発表者名
      寺園泰、山西健司
    • 学会等名
      第16回情報論的学習理論ワークショップ(IBIS2013)
    • 発表場所
      東京、東工大
    • 年月日
      20131110-20131113
  • [学会発表] 欠測データからのRBM学習の性能評価2013

    • 著者名/発表者名
      坂井良樹、山西健司
    • 学会等名
      第16回情報論的学習理論ワークショップ(IBIS2013)
    • 発表場所
      東京、東工大
    • 年月日
      20131110-20131113
  • [学会発表] 独立成分分析に基づく時系列データの潜在的変化検知2013

    • 著者名/発表者名
      赤坂拓哉、山西健司
    • 学会等名
      第16回情報論的学習理論ワークショップ(IBIS2013)
    • 発表場所
      東京、東工大
    • 年月日
      20131110-20131113
  • [学会発表] 行列因子分解を用いた時系列試験結果からの潜在スキル構造の抽出2013

    • 著者名/発表者名
      大枝真一, 天野恵理子, 山西健司
    • 学会等名
      第16回情報論的学習理論ワークショップ(IBIS2013)
    • 発表場所
      東京、東工大
    • 年月日
      20131110-20131113
  • [学会発表] 時空間クラスタリングに基づく緑内障進行予測の研究2013

    • 著者名/発表者名
      梁曾漢、冨岡亮太、村田博史、朝岡亮、山西健司
    • 学会等名
      第16回情報論的学習理論ワークショップ(IBIS2013)
    • 発表場所
      東京、東工大
    • 年月日
      20131110-20131113
  • [学会発表] An NML-based model selection criterion for general relational data modeling2013

    • 著者名/発表者名
      Yoshiki Sakai, Kenji Yamanishi
    • 学会等名
      2013 IEEE International Conference on BigData
    • 発表場所
      Silicon Valley, USA
    • 年月日
      20131006-20131009
  • [学会発表] Stochastic complexity for piecewise stationary memoryless sources2013

    • 著者名/発表者名
      Kenji Yamanishi, Hiroki Kanazawa
    • 学会等名
      Workshop on Information-Theoretic Methods in Science and Engineering
    • 発表場所
      東京、東大
    • 年月日
      20130826-20130829
    • 招待講演
  • [学会発表] Extracting time-evolving latent skills from examination time series2013

    • 著者名/発表者名
      Shin-ichi Oeda, Kenji Yamanishi
    • 学会等名
      The 6th International Conference on Educational Data Mining (EDM2013)
    • 発表場所
      Memphis, USA
    • 年月日
      20130706-20130709
  • [図書] 情報論的学習とデータマイニング2014

    • 著者名/発表者名
      山西健司
    • 総ページ数
      168
    • 出版者
      朝倉書店
  • [図書] ビッグデータ・マネジメント― データサイエンティストのためのデータ利活用技術と事例( ネットワーク分析のための機械学習)2014

    • 著者名/発表者名
      鹿島久嗣
    • 総ページ数
      240
    • 出版者
      NTS出版
  • [備考] 数理第6研究室ホームページ

    • URL

      http://ibis.t.u-tokyo.ac.jp/

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi