2009 Fiscal Year Annual Research Report
統計モデリングとデータマイニングに基づくネットワーク化知識の創出と活用
Project/Area Number |
20300038
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 Kobe University, 工学研究科, 准教授 (50321576)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳弘 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
大川 剛直 神戸大学, 工学研究科, 教授 (30223738)
尾崎 知伸 神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (40365458)
|
Keywords | 統計モデリング / データマイニング / 情報検索 / 確率的トピックモデル / 確率的言語モデル / 適合モデル / グラフマイニング / 複雑ネットワーク分析 |
Research Abstract |
本課題は、統計モデリング技術とデータマイニング技術を駆使・拡張し、断片的に散在した情報コンテンツから、人間の知的活動に直接活用可能なネットワーク化知識を創出し、活用する手段の確立をめざす。この目的のもと、平成21年度は、以下の研究項目に取り組んだ。 1.学術文献における専門用語間の関係性を定量化する問題において、潜在トピックに着目し、そのモデル化方法、推定方法、語間類似度の計算方法、および、トピック数による性能の違いを明らかにした。また、それらをタンパク質相互関係に関する仮説生成に応用した。 2.部分的に観測されるネットワークから潜在的な構造を統計的に推定し、それを用いて未観測のリンクを予測する手法を開発した。当該手法に用いた生物学的ネットワークにおけるリンク予測の有効性を評価するとともに、さらにそれに文献から得られた知識を統合することによる効果を実証した。 3.ブログポストの潜在的トピックに着目して、ブログポスト間のハイパーリンクで不適切なものを検出し、除外することにより、情報伝搬ネットワークを的確に抽出する手法を開発した。また、実際の日本語ブログデータを用いた実験によって、提案手法の有効性を示した。 4.頂点に定量的アイテム集合をもつ単一グラフを対象とした、頻出パターン発見システムを実現した。また、グラフの構成要素とグラフそのものに重みが付与された、内部及び外部重み付きグラフを対象に、種々の観点での特徴的パターンを効率的に獲得するアルゴリズムの開発に成功した。
|
Research Products
(20 results)