2002 年度実績報告書

大規模テキストを対象とした質問応答技術の高度化に関する研究

研究課題

研究課題/領域番号	14380155
研究機関	東京大学
研究代表者	加藤恒昭東京大学, 大学院・総合文化研究科, 助教授 (60334299)
研究分担者	中澤恒子東京大学, 大学院・総合文化研究科, 助教授 (00292839)
キーワード	質問応答 / 対話処理 / テキスト処理 / 情報アクセス / 情報検索 / 情報抽出
研究概要	大規模テキストを対象とした質問応答とは,利用者からの任意の質問に対して,蓄積された大規模テキストを参照して回答するというもので,質問という形で利用者の視点・観点を受け取り,それを考慮した情報の収集・取捨選択を行うと同時に,文書全体というような情報発信者が規定した形式に捕われ,利用者が真に必要とする情報だけを提供するという特徴を持つ.本研究は,この質問応答技術を高度化し,利用者を中心に据えた高度な情報アクセスの手段として確立することを目的とするものである.今期は,ベースシステムとして情報検索技術,情報抽出技術を応用した質問応答システムを構築を行った.既存技術である全文検索システムおよび意味辞書を用いて,固有表現抽出機能は新たに実装し,質問解析については,パタン主導による浅い解析を用い,回答抽出には,語の意味カテゴリとその出現頻度や出現位置を主な情報とした統計ベースの処理を採用している.今後,本システムの分析を通じて,既存技術の適用範囲と限界を明らかにしていく.加えて,質問応答の高度化へ向けて,質問応答における文脈の扱いについて検討を行った.現在の質問応答技術特に質問解析技術は,一問一答を前提としているが,対話的に連続した質問応答を扱わせるためにはどのような拡張が必要であるか,その時の文脈処理技術にはどのような機能が必要とされるかを検討した.現在,それら機能を確認するための質問セットを構築中である.

研究成果
(2件)

すべてその他

すべて文献書誌 (2件)

[文献書誌] 奥村学: "テキスト処理研究の動向-情報抽出・自動要約・質問応答における評価ワークショップの重要性"人工知能学会学会誌. Vol.17, No.3. 301-305 (2002)
[文献書誌] Tsuneaki Kato: "Answering it with charts--Dialogue in natural language and charts"The 19th International Conference on Computational Linguistics (COLING2002). Vol.1. 418-424 (2002)