2006 Fiscal Year Annual Research Report
Webを対象とした意見情報のマイニングに関する研究
Project/Area Number |
17680011
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 神戸大学, 自然科学研究科, 助教授 (50321576)
|
Keywords | 意見情報検索 / 意見マイニング / レビューマイニング / 確率的言語モデル / 適合モデル / 情報ボトルネック法 / クラスタリング / 情報検索 |
Research Abstract |
今年度は、昨年度に引き続き、確率的言語モデルによる意見情報検索モデルの検討を行った。特定の製品や作品、人物や組織、概念やイベント(以下、「トピック」)に関する意見の情報を的確に検出し検索可能にするため、これら意見情報の確率的生成モデルを開発した。提案手法は、検索の結果得られた文単位の情報を用いてトピックに関する適合モデルと意見に関する適合モデルを構築し、これらを組み合わせることで特定のトピックに関するレビューや意見を的確に検索することを可能にする。意見情報のアノテーションが付与された文書データを用いて意見文抽出の実験を行い、提案モデルの有効性を確認した。評価型プロジェクト「TREC Blog Track」にも参加し、プログを対象とした意見情報検索の実験を行った。 また、上述の意見生成モデルにおいて必要となる意見語彙を効果的に構築するための、対話型クラスタリング手法を開発した。提案手法は、(i)利用者が特徴素のタイプならびに特徴素の典型例(以下、「シード特徴素」)を指定し、文書をシード特徴素の分布により表現してクラスタリングを実行する。(ii)情報ボトルネック法によって、文書クラスタに出現するすべての特徴素のクラスタリングを実行する。(iii)シード特徴素を含む特徴素クラスタを利用者に提示し、利用者が編集を行った上で、それらを新たなシード特徴素と見なして上記(i)を繰り返す。提案手法をウェブ上の映画評データに適用した実証実験を行い、当該手法の有効性を確認した。 さらに、語間依存性と関連性を考慮した検索クエリ構築手法について、昨年度に引き続いて検討した。この手法により、上で述べた意見情報検索の有効性を底上げすることが期待される。
|