研究課題/領域番号 |
17680011
|
研究種目 |
若手研究(A)
|
配分区分 | 補助金 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 神戸大学 (2006-2007) 国立情報学研究所 (2005) |
研究代表者 |
江口 浩二 神戸大学, 大学院・工学研究科, 准教授 (50321576)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
12,220千円 (直接経費: 9,400千円、間接経費: 2,820千円)
2007年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2006年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2005年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
|
キーワード | 意見情報検索 / 意見マイニング / 意見文抽出 / 確率的言語モデル / 適合モデル / 情報ボトルネック法 / 情報検索 / クラスタリング / レビューマイニング / 意見検索 / レビュー検索 / 語の依存関係 / 複合語 |
研究概要 |
本研究では、企業活動における市場調査や顧客満足度調査、日常生活における購買意志決定など、様々な場面でますます重要性を増している意見情報に着目し、検索、抽出、マイニングに関して設計、開発、評価に取り組んできた。これまでに得られた主な成果は以下の通りである。 (1) 確率的言語モデルによる意見情報検索モデルを提案した。特定の製品や作品、人物や組織、概念やイベント(以下、「トピヅク」)に関する意見の情報を的確に検出し検索可能にするため、このような意見情報に関して確率的生成モデルの枠組みで形式化を行った。また、適合モデルと呼ばれる技術を拡張し、トピックと意見の依存性を反映したモデル推定手法を開発した。さらに、文レベルでの意見情報検索に関して様々な観点から実験を行い、提案モデルの有効性を示した。 (2) 上述の意見文抽出タスクを想定し、着目する文の周辺文脈を利用したスムージング手法を開発した。また、検索有効性の観点から評価実験を行い、提案手法の有効性を示した。 (3) 上記(1)に述べた検索モデルをブログに適用し、文書レベルの意見情報検索に関して有効性の評価を行った。評価ワークショップ「TREC Blog Track」に参加し、89ギガバイトのブログデータを用いた実験を実施した。 (4) 以上に述べた意見情報検索モデルにおいて必要となる意見語彙を効果的に構築するための、対話的クラスタリング手法を開発した。提案手法は、情報ボトルネック法の枠組みに基づき、利用者が意見語の選択を行うことで、対話的に文書ならびに意見語のクラスタリングを行うものである。提案手法をウェブ上の映画評データに適用した実証実験を行い、提案手法の有効性を確認した。
|