2007 Fiscal Year Annual Research Report
情報爆発時代に対応する質問応答基盤技術に関する研究
Project/Area Number |
19024033
|
Research Institution | Yokohama National University |
Principal Investigator |
森 辰則 Yokohama National University, 大学院・環境情報研究院, 教授 (70212264)
|
Co-Investigator(Kenkyū-buntansha) |
田村 直良 横浜国立大学, 大学院・環境情報研究院, 教授 (20179906)
|
Keywords | 質問応答 / 定義型質問 / 言語横断処理 / ディレクトリ・情報検索 / 画像,文章,音声等認識 |
Research Abstract |
本研究では、情報爆発時代における人に優しい情報アクセスの一手法として質問応答技術を位置づけ、大量かつ多様な文書を知識源とする質問応答に関する基盤技術を確立する。さらに、人に優しいインタフェースという観点から一連の関連する質問文群を適切に解釈し、対話における質問応答処理を行う仕組みについても検討する。情報爆発の量・多様性の両側面に包括的に対応し、さらに、対話環境でも利用可能な質問応答システムを構築する点が本研究の特色である。本年度は、下記の知見を得た。 1.Web質問応答における複数検索エンジンの組合せによる精度向上 複数の検索エンジンを組合せることにより、情報源の多様性を増す事ができると期待される。そこで検索結果を組み合わせるタイミングに注目し、3手法を比較検討した。その結果、各検索エンジンの出力を個別にQAエンジンで処理し、その解候補を後に併合する方法が効果的であることが分かった。 2.Web文書を用いた名詞句の翻訳と機械翻訳とを併用した英日言語横断質問応答 機械翻訳システムが持つ翻訳辞書に未収録の語句の翻訳に対応するために、次に示す、Web文書を用いた名詞句の翻訳手法3種を導入する方法を検討した:a)Wikipediaを用いた句の翻訳手法、b)Web検索の結果だけを用いた手法、c)Web検索結果と読みの情報を用いた句の翻訳手法。その有効性をNTCIR-6 CLQAにおいて示した。 3.語彙統語パタンと語彙的連鎖によるパッセージ抽出に基づく記述的回答が可能な質問応答 定義・理由等の記述的な回答をするnon-factoid型質問応答が期待されている。我々はHanらのモデルをnon-factoid型質問一般に拡張し、回答候補の適切性判定を、a)記述形式の適切さ、ならびに、b)質問内容との関連性の組み合わせにより測ることを検討している。その有効性をNTCIR-6 QACにおいて示した。
|
Research Products
(13 results)