研究課題
本研究では、企業活動における市場調査や顧客満足度調査、日常生活における購買意志決定など、様々な場面でますます重要性を増している意見情報に着目し、検索、抽出、マイニングに関して設計、開発、評価に取り組んできた。これまでに得られた主な成果は以下の通りである。(1) 確率的言語モデルによる意見情報検索モデルを提案した。特定の製品や作品、人物や組織、概念やイベント(以下、「トピヅク」)に関する意見の情報を的確に検出し検索可能にするため、このような意見情報に関して確率的生成モデルの枠組みで形式化を行った。また、適合モデルと呼ばれる技術を拡張し、トピックと意見の依存性を反映したモデル推定手法を開発した。さらに、文レベルでの意見情報検索に関して様々な観点から実験を行い、提案モデルの有効性を示した。(2) 上述の意見文抽出タスクを想定し、着目する文の周辺文脈を利用したスムージング手法を開発した。また、検索有効性の観点から評価実験を行い、提案手法の有効性を示した。(3) 上記(1)に述べた検索モデルをブログに適用し、文書レベルの意見情報検索に関して有効性の評価を行った。評価ワークショップ「TREC Blog Track」に参加し、89ギガバイトのブログデータを用いた実験を実施した。(4) 以上に述べた意見情報検索モデルにおいて必要となる意見語彙を効果的に構築するための、対話的クラスタリング手法を開発した。提案手法は、情報ボトルネック法の枠組みに基づき、利用者が意見語の選択を行うことで、対話的に文書ならびに意見語のクラスタリングを行うものである。提案手法をウェブ上の映画評データに適用した実証実験を行い、提案手法の有効性を確認した。
すべて 2008 2007
すべて 雑誌論文 (6件) (うち査読あり 3件) 学会発表 (2件)
情報処理学会研究報告 Vol.2008,No.33
ページ: 83-90
Proceedings of the 29th European Conference on Information Retrieval Vol. LNCS-4425
ページ: 393-404
Proceedings of the International Workshop on Data-Mining and Statistical Science なし
ページ: 165-178
Proceedings of the 16th Text Retrieval Conference なし
Pre-Proceedings of the 6th Worksshop of the Initative for the Evaluation of XML Retrieval なし
ページ: 261-268
情報処理学会データベースとWeb情報システムに関するシンポジウム論文集 なし