研究概要 |
現在までにKandolaらのノイマンカーネルを複数のコミュニティが存在する引用関係グラフに適用する際に生ずる間題点について議論を展開した.ノイマンカーネルはパラメタ調整によって,個々の論文に対して,関連論文あるいは重要論文をランク付けして提示できる.しかし,パラメタを重要度に偏らせると引用グラフ全体における支配的なコミュニティの重要論文のみが,個々の論文が属するコミュニティにかかわらず,上位にランキングされてしまうという間題を指摘した. これに対して我々は,引用の生成過程をHofmannのpLSI(probabilistic Latent Semantic Indexing)によりモデル化し,その結果を用いて,コミュニティごとの重みつき引用グラフ(コミュニティグラフ)を計算する.これらのグラフは,引用の各コミュニティに対する帰属確率を計算し,弧の重みとするため,同一の引用が,複数のコミュニティグラフに異なった重みのもとで存在することができる(多重コミュニティ).得られたコミュニティグラフにノイマンカーネルを適用することによって,対象論文が属するコミュニティを考慮して重要論文を推薦,提示できることを示した. さらに,提案手法の性能の検証を行うために,技術文書の提案システムに適用し,他のアルゴリズムとの比較を行った.結果,提案手法が既存のアルゴリズムに対して性能が向上すること確認した.
|