2004 Fiscal Year Annual Research Report
大規模テキストを対象とした質問応答技術の高度化に関する研究
Project/Area Number |
14380155
|
Research Institution | The University of Tokyo |
Principal Investigator |
加藤 恒昭 東京大学, 大学院・総合文化研究科, 助教授 (60334299)
|
Co-Investigator(Kenkyū-buntansha) |
中澤 恒子 東京大学, 大学院・総合文化研究科, 助教授 (00292839)
|
Keywords | 質問応答 / 対話処理 / テキスト処理 / 情報アクセス / 情報検索 / 情報抽出 |
Research Abstract |
大規模テキストを対象とした質問応答とは,利用者からの任意の質問に対して,蓄積された大規模テキストを参照して回答するというもので,質問という形で利用者の視点・観点を受け取り,それを考慮した情報の収集・取捨選択を行うと同時に,文書全体というような情報発信者が規定した形式にとらわれず,利用者が真に必要とした情報だけを提供するという特徴を持つ.本研究は,この質問応答技術を高度化し,利用者を中心に据えた高度な情報アクセス手段として確立することを目的とするものである. 今期は対話的な状況での質問応答技術の利用についての研究をすすめた.利用者が与えられたトピックについてレポートを作成する際にどのような質問を行うかの調査結果と,その調査に基づいて作成した質問応答技術評価のためのテストセット,更にそのテストセットを用いた現状システムの評価結果を分析した.その結果,ここで作成したテストセットとその枠組みは,対話的状況での質問応答技術評価に適切なものであること,現状の質問応答技術は文脈処理の点でまだ改善の余地があること,正解の列挙を求めるリスト型質問については理論的に未整理の問題が残されていること,等を明らかにした. 質問応答技術を情報可視化技術,文書要約技術と結びつけて,新しい情報アクセスを可能とするための研究トピックである「動向情報の要約と可視化」を提示し,そのための研究やシステムの枠組みを提案すると共に,その研究のために有用であるデータセットを作成した.特に新聞記事に対して,要約と可視化の観点から意味的な情報を注釈づけるための仕様の設計を行った. 本研究の成果発表および情報収集のために,5月に米国ボストンで行われたNAACL/HLT,10月に同ガイザースバーグで行われたTRECに参加した.国内でも4回の研究発表を行った.
|