2008 Fiscal Year Annual Research Report
統計モデリングとデータマイニングに基づくネットワーク化知識の創出と活用
Project/Area Number |
20300038
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 Kobe University, 工学研究科, 准教授 (50321576)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
大川 剛直 神戸大学, 工学研究科, 教授 (30223738)
尾崎 知伸 神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (40365458)
|
Keywords | 統計モデリング / データマイニング / 確率的生成モデル / 確率的トピックモデル / 確率的言語モデル / 情報検索 / グラフマイニング / 複雑ネットワーク分析 |
Research Abstract |
本課題は、統計モデリング技術とデータマイニング技術を駆使・拡張し、断片的に散在した情報コンテンヅから、人間の知的活動に直接活用可能なネヅトワーク化知識を創出し、活用する手段の確立をめざす。この目的のもと、平成20年度は、以下の研究項目に取り組んだ。 1.複数のタグで構造化された文書においてタグ間の依存関係を反映しつつ潜在的な話題構造を表現する多型トピックモデルを開発し、それをギブスサンプリング法により推定することによって、テキストデータからの社会ネヅトワーク抽出、および、構造化文書検索などの応用を実現した。 2.学術文献における専門用語間の関係性を定量化する問題において、潜在トピックに着目し、そのモデル化方法、推定方法、語間類似度の計算方法、および、トピック数による性能の違いを明らかにした。 3.部分的に観測されるネットワーク構造から潜在的な頂点グループを統計的に推定し、それを用いて未観測のリンクを予測する手法を開発した。現実の社会ネットワーク(共著ネットワーク)および生物学的ネットワーク(代謝ネットワーク)を用いた評価実験において優れた有効性を実現した。 4.頂点に構造をもつグラフ(複合構造グラフ)を対象とした、効率的な特徴的パターン発見システムを実現した。また、各属性が構造データで表現される多次元構造データベースを対象に、集合内の各要素が相互に依存するようなパターンの集合を獲得するアルゴリズムの開発に成功した。
|
Research Products
(24 results)