2007 Fiscal Year Annual Research Report
Webを対象とした意見情報のマイニングに関する研究
Project/Area Number |
17680011
|
Research Institution | Kobe University |
Principal Investigator |
江口 浩二 Kobe University, 大学院・工学研究科, 准教授 (50321576)
|
Keywords | 意見情報検索 / 意見マイニング / 意見文抽出 / 確率的言語モデル / 適合モデル / 情報ボトルネック法 / 情報検索 / クラスタリング |
Research Abstract |
本研究では、企業活動における市場調査や顧客満足度調査、日常生活における購買意志決定など、様々な場面でますます重要性を増している意見情報に着目し、検索、抽出、マイニングに関して設計、開発、評価に取り組んできた。これまでに得られた主な成果は以下の通りである。 (1) 確率的言語モデルによる意見情報検索モデルを提案した。特定の製品や作品、人物や組織、概念やイベント(以下、「トピヅク」)に関する意見の情報を的確に検出し検索可能にするため、このような意見情報に関して確率的生成モデルの枠組みで形式化を行った。また、適合モデルと呼ばれる技術を拡張し、トピックと意見の依存性を反映したモデル推定手法を開発した。さらに、文レベルでの意見情報検索に関して様々な観点から実験を行い、提案モデルの有効性を示した。 (2) 上述の意見文抽出タスクを想定し、着目する文の周辺文脈を利用したスムージング手法を開発した。また、検索有効性の観点から評価実験を行い、提案手法の有効性を示した。 (3) 上記(1)に述べた検索モデルをブログに適用し、文書レベルの意見情報検索に関して有効性の評価を行った。評価ワークショップ「TREC Blog Track」に参加し、89ギガバイトのブログデータを用いた実験を実施した。 (4) 以上に述べた意見情報検索モデルにおいて必要となる意見語彙を効果的に構築するための、対話的クラスタリング手法を開発した。提案手法は、情報ボトルネック法の枠組みに基づき、利用者が意見語の選択を行うことで、対話的に文書ならびに意見語のクラスタリングを行うものである。提案手法をウェブ上の映画評データに適用した実証実験を行い、提案手法の有効性を確認した。
|