本研究では、情報爆発時代における人に優しい情報アクセスの一手法として質問応答技術を位置づけ、大量かつ多様な文書を知識源とする質問応答に関する基盤技術を確立する。さらに、人に優しいインタフェースという観点から一連の関連する質問文群を適切に解釈し、対話における質問応答処理を行う仕組みについても検討する。情報爆発の量・多様性の両側面に包括的に対応し、さらに、対話環境でも利用可能な質問応答システムを構築する点が本研究の特色である。本年度は、下記の知見を得た。 1. 任意の型の記述的回答が可能な日本語Web質問応答システム 任意の型の記述的回答ができる質問応答の手法について検討をした。具体的には、Q&Aコミュニティサービスの質問・回答事例集合を用いることにより、質問の型分類を行なわない新しいアプローチを提案した。入力された質間文に対して、「記述スタイル」(ある質問の仕方に特有の回答の仕方)が類似する質問事例をコーパスから収集し、対応する回答文の事例集合から回答の記述スタイルに関する特徴表現を動的に取得する。評価実験により提案手法の有効性を示した。 2. 上記質問応答システムをエンジンとする記述的な回答な可能な英日言語横断質問応答 言語の多様性の側面に対応するために、質問の言語とは異なる言語で記述された情報源から答を捜し出す言語横断質問応答(CLQA)について検討した。特に、上記1で構成した日本語質問応答システムを、昨年度提案した、Web文書を用いた名詞句の翻訳手法と機械翻訳とを併用する質問文翻訳方式と組み合わせることにより、英日CLQAシステムが構築できることを示した。 3. 機械学習を用いた二段階洗練化手法による人物説明記述の抽出 質問応答の精度向上を目的として、定義型質問応答の核の一つとなる人物に関する説明記述を精度良く抽出する手法について検討し、同手法により高精度を実現できることを示した.
|