研究課題
今年度は、昨年度に引き続き、確率的言語モデルによる意見情報検索モデルの検討を行った。特定の製品や作品、人物や組織、概念やイベント(以下、「トピック」)に関する意見の情報を的確に検出し検索可能にするため、これら意見情報の確率的生成モデルを開発した。提案手法は、検索の結果得られた文単位の情報を用いてトピックに関する適合モデルと意見に関する適合モデルを構築し、これらを組み合わせることで特定のトピックに関するレビューや意見を的確に検索することを可能にする。意見情報のアノテーションが付与された文書データを用いて意見文抽出の実験を行い、提案モデルの有効性を確認した。評価型プロジェクト「TREC Blog Track」にも参加し、プログを対象とした意見情報検索の実験を行った。また、上述の意見生成モデルにおいて必要となる意見語彙を効果的に構築するための、対話型クラスタリング手法を開発した。提案手法は、(i)利用者が特徴素のタイプならびに特徴素の典型例(以下、「シード特徴素」)を指定し、文書をシード特徴素の分布により表現してクラスタリングを実行する。(ii)情報ボトルネック法によって、文書クラスタに出現するすべての特徴素のクラスタリングを実行する。(iii)シード特徴素を含む特徴素クラスタを利用者に提示し、利用者が編集を行った上で、それらを新たなシード特徴素と見なして上記(i)を繰り返す。提案手法をウェブ上の映画評データに適用した実証実験を行い、当該手法の有効性を確認した。さらに、語間依存性と関連性を考慮した検索クエリ構築手法について、昨年度に引き続いて検討した。この手法により、上で述べた意見情報検索の有効性を底上げすることが期待される。
すべて 2007 2006
すべて 雑誌論文 (9件)
Proceedings of the 20th International Joint Conference on Artificial Intelligence (IJCAI-07), IIyderahad, India
ページ: 684-689
電子情報通信学会第二種研究会資料,第8回Webインテリジェンスとインタラクション研究会 WI2-2007-19
ページ: 97-102
Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing (EMNLP 2006), Sydney, Australia
ページ: 345-354
Information Retrieval Technology : Third Asia Information Retrieval Symposium, Singapore, Lecture Notes in Computer Science Vol.4182
ページ: 522-529
Proceedings of the 15th ACM Conference on Information and Knowledge Management (CIKM 2006), Arlington, Virginia, USA
ページ: 792-793
Proceedings of the Document Understanding Conference 2006 (DUC 2006), New York City, New York, USA
ページ: 122-130
情報処理学会研究報告 2006-FI-84/2006-NL-175
ページ: 127-134
UMass CIIR Technical Report IR-472
Proceedings of the 15th Text REtrieval Conference (TREC 2006), Gaithersburg, Maryland, USA