• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

大規模構造データに対する確率モデル推定に基づく知識の創出と活用

Research Project

Project/Area Number 23300039
Research Category

Grant-in-Aid for Scientific Research (B)

Research InstitutionKobe University

Principal Investigator

江口 浩二  神戸大学, システム情報学研究科, 准教授 (50321576)

Co-Investigator(Kenkyū-buntansha) 高須 淳弘  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
大川 剛直  神戸大学, システム情報学研究科, 教授 (30223738)
Keywords統計的機械学習 / 情報検索 / ネットワーク分析 / データマイニング / 確率的トピックモデル / 混合メンバシップモデル / グラフィカルモデル / マルコフ連鎖モンテカルロ法
Research Abstract

本研究課題は、内部構造または外部構造を持つテキストデータやネットワークデータに対して潜在的な構造を発見する技術を開発することを目的とする。ここでいう内部構造とは、テキストデータについては各単語トークンが離散属性で特徴づけられたものを指し、ネットワークデータについては各辺または頂点が離散属性で特徴づけられたものを指す。また、外部構造の例としては、木やグラフで表現されたカテゴリ構造における各頂点にテキストデータが割り当てられたものが挙げられる。以上に述べたような複雑な構造をもつ大規模データから低次元の潜在変数表現を推定することで、情報検索、リンク予測などの様々な問題に利用可能な「知識」を抽出することを目指す。平成23年度は主として下記の項目の研究を実施した。
1.Wikipedieaを典型とする多言語間で比較可能なデータを対象とし、言語を横断したトピック構造を発見する問題に取り組んだ。特定の事物や人物に関する複数言語にわたる説明記事群を1つの文書と見なし、各言語を属性と見なして、属性間の依存性を考慮した潜在変数モデルを仮定することにより、言語横断的なトピック構造を推定することに成功した。
2.ネットワークデータに対して、各頂点の潜在グループを確率分布で表現して辺の生成過程をモデル化する混合メンバシップ・ブロックモデルを、補助情報が与えられた状況下での情報推薦の問題に適用し、従来手法と比較して統計的に有意な精度改善を実現した。
3.カテゴリ木構造における各頂点に文書群が割り当てられたデータコレクションから、潜在トピックを発見する問題に取り組んだ。それに適した潜在変数モデルの未知パラメータをマルコフ連鎖モンテカルロ法によって推定する過程で、カテゴリの粒度(部分木の高さ)に関するモデル選択を導入した。予備実験により、提案方法を用いることで推定精度が改善することを示した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

交付申請書に記載した研究計画にそって研究が進展したため。

Strategy for Future Research Activity

今年度は本研究課題の関連領域において実績のある米国カーネギーメロン大学の研究グループと議論を行った。来年度も同様に実施することで、本研究課題を効率的に推進できることが期待される。

  • Research Products

    (12 results)

All 2012 2011 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (8 results) Remarks (1 results)

  • [Journal Article] MPI/OpenMP Hybrid Parallel Inference for Latent Dirichlet Allocation2011

    • Author(s)
      Shotaro Tora, Koji Eguchi
    • Journal Title

      Proceedings of the 3rd Workshop on Large Scale Data Mining : Theory and Applications

    • DOI

      10.1145/2002945.2002950

    • Peer Reviewed
  • [Journal Article] A Recommendation Algorithm Using Positive and Negative Latent Models2011

    • Author(s)
      Atsuhiro Takasu, Saranya Maneeroj
    • Journal Title

      Proceedings of the 2011 IEEE Symposium on Computational Intelligence and Data Mining

      Pages: 72-79

    • DOI

      10.1109/CIDM.2011.5949455

    • Peer Reviewed
  • [Journal Article] A Multicriteria Recommendation Method from Data with Missing Rating Scores2011

    • Author(s)
      Atsuhiro Takasu
    • Journal Title

      Proceedings of the 2011 International Conference on Data and Knowledge Engineering

      Pages: 60-67

    • DOI

      10.1109/ICDKE.2011.6053931

    • Peer Reviewed
  • [Presentation] 局所特徴のバースト性を考慮した異種メディアの統合的なモデル化2012

    • Author(s)
      西原聖志, 江口浩二
    • Organizer
      第4回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      (兵庫県)シーサイドホテル舞子ビラ神戸
    • Year and Date
      2012-03-05
  • [Presentation] カテゴリ階層を考慮した確率的トピックモデルのモデル選択付き学習2012

    • Author(s)
      山本浩平, 江口浩二, 高須淳宏
    • Organizer
      第4回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      (兵庫県)シーサイドホテル舞子ビラ神戸
    • Year and Date
      2012-03-04
  • [Presentation] 多腕バンディットによる検索結果の多様化に関する大規模クリックスルーログを用いた評価2012

    • Author(s)
      下田敬祐, 江口浩二
    • Organizer
      第4回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      (兵庫県)シーサイドホテル舞子ビラ神戸
    • Year and Date
      2012-03-04
  • [Presentation] 混合メンバシップ・ブロックモデルのオンライン学習2012

    • Author(s)
      小林知己, 江口浩二
    • Organizer
      第4回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      (兵庫県)シーサイドホテル舞子ビラ神戸
    • Year and Date
      2012-03-03
  • [Presentation] マルチタイプ混合メンバーシップ・ブロックモデルを用いた情報推薦2011

    • Author(s)
      横峯樹, 江口浩二
    • Organizer
      第14回情報論的学習理論ワークショップ
    • Place of Presentation
      (奈良県)奈良女子大学
    • Year and Date
      2011-11-09
  • [Presentation] Symmetric Correspondence Topic Modelsによる多言語トピック抽出2011

    • Author(s)
      福増康佑, 松浦愛美, 江口浩二
    • Organizer
      第14回情報論的学習理論ワークショップ
    • Place of Presentation
      (奈良県)奈良女子大学
    • Year and Date
      2011-11-09
  • [Presentation] 正則化付きリンク構造解析を用いたコールドスタート推薦2011

    • Author(s)
      内藤慎也, 江口浩二
    • Organizer
      情報処理学会第153回データベースシステム研究会
    • Place of Presentation
      (東京都)エステック情報ビル
    • Year and Date
      2011-11-03
  • [Presentation] 多言語トピックモデルによる言語横断リンク検出2011

    • Author(s)
      福増康佑, 松浦愛美, 江口浩二
    • Organizer
      情報処理学会第201回自然言語処理研究会・第86回音声言語情報処理研究会
    • Place of Presentation
      (東京都)東京大学
    • Year and Date
      2011-05-16
  • [Remarks]

    • URL

      http://www.prmir.scitec.kobe-u.ac.jp/

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi