2008 Fiscal Year Annual Research Report
テキストマイニングとの融合による高度オープンドメイン質問応答の実現
Project/Area Number |
19500121
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
秋葉 友良 Toyohashi University of Technology, 工学部, 准教授 (00356346)
|
Co-Investigator(Kenkyū-buntansha) |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Keywords | オープンドメイン質問応 / テキストマイニング / 情報検索 / 音声ドキュメント処理 |
Research Abstract |
発掘型質問を対象とする質問応答システムについて、前年度の調査結果に基づき、入力質問文字列から各タイプの意味表現を抽出する質問文解析器を構築した。解析器は、正規表現パターンによる人手で作成した規則に基づいて実装を行った。また、ルールベースの手法では多様な入力質問文字列に対応するには限界があると考え、質問データベースの類似質問との類似度に基づく事例ベースの質問解析手法も実装した。一方、調査結果の質問例について、新聞記事を対象に回答候補抽出法について検討を行った。検索結果には間違った情報が多く含まれるため、それらの選別・統合方法が今後の課題である。 実世界質問全般に回答するユニバーサル質問応答については、非factoid型の質問応答の拡張・性能改善を行った。特に、入力質問と回答候補の間の、予測される回答タイプの一致の判定に利用する特徴量抽出法について検討を行った。従来は特徴量として機能語と品詞化した内容語を利用していたが、さらに質問に現れる内容語を他の内容語と区別して抽象化した特徴量を考案し、その利用による性能の向上を確認した。ニュース音声・学会講演音声などの音声ドキュメントを対象とする質問応答では,昨年度開発した認識誤りに頑健な翻訳モデルに基づく検索手法に加え、文脈を利用した文書拡張手法、言語モデルに基づく検索手法を利用することを試み、それらの併用による検索性能の向上を確認した。
|