2012 Fiscal Year Annual Research Report
大規模構造データに対する確率モデル推定に基づく知識の創出と活用
Project/Area Number |
23300039
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 神戸大学, その他の研究科, 准教授 (50321576)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳宏 国立情報学研究所, 大学共同利用機関等の部局等, 教授 (90216648)
大川 剛直 神戸大学, その他の研究科, 教授 (30223738)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | 潜在変数モデル / 混合メンバシップモデル / トピックモデル / ノンパラメトリックベイズモデル / 多言語解析 / 異種ネットワーク解析 / 国際情報交換(米国) |
Research Abstract |
平成25年度は主として下記の項目の研究成果を達成した。 1. 複数の表現からなるデータに着目し、データ表現間の依存性を的確に捉えつつ次元削減を実現するSymmetric Correspondence Topic Modelsなる潜在変数モデルを提案した。本提案モデルの主な特徴の一つは、各データを構成する複数のデータ表現から主軸となる表現を予め特定する必要性がない点にあり、その適用範囲は広い。提案モデルを言語間比較可能テキストデータから言語を横断して潜在トピック構造を推定する問題に適用し、その有効性を示した。モデルの未知パラメータと潜在変数は周辺化ギブスサンプリング法で推定した。 2. 各辺または頂点に離散ラベルが付与されたネットワーク表現に対して、頂点ごとに確率分布で表現された潜在グループを仮定して辺とラベルの生成過程をモデル化した。例として、利用行動履歴と補助情報によるネットワーク表現に適用し、情報推薦問題における提案モデルの有効性を評価した。モデルの未知パラメータと潜在変数は周辺化ギブスサンプリング法で推定した。 3. グループ化された離散データのための潜在変数モデルとして広く受け入れられている潜在的ディリクレ配分法(LDA)および階層ディリクレ過程(HDP)の高速推定を目的とした並列化アルゴリズムを開発した。現在広く普及している対称型マルチプロセッシング・クラスタを想定して、計算ノード内でマルチコア・プロセッサで行う並列処理の結果を集約し、その上でMPIと呼ばれる通信ライブラリを用いて計算ノード間で通信する方法を用いた。この条件のもとで周辺化ギブスサンプリング法を並列化し、推定処理の効率化を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね平成24年度交付申請書に記載した研究計画にそって研究が進展したため。
|
Strategy for Future Research Activity |
平成24年度は米国カーネギーメロン大学を訪問し、本研究課題の関連領域において実績のあるEric P. Xing准教授らの研究グループと議論を行った。来年度は主に電子的な手段で海外研究者と情報交換を行う予定である。
|
Research Products
(5 results)