2009 Fiscal Year Annual Research Report
テキストマイニングとの融合による高度オープンドメイン質問応答の実現
Project/Area Number |
19500121
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
秋葉 友良 Toyohashi University of Technology, 工学部, 准教授 (00356346)
|
Co-Investigator(Kenkyū-buntansha) |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Keywords | オープンドメイン質問応答 / テキストマイニング / 情報検索 / 音声ドキュメント処理 |
Research Abstract |
発掘型質問について、新聞記事を対象とした回答抽出法を具体化した回答タイプ毎の回答抽出ルールを作成した。前年度に構築した質問文解析器と組み合わせて、質問応答システムの実装を行った。ただし、抽出結果にはまだ誤りが多く、精度の向上に課題が残されている。ユニバーサル質問応答については、前年度に検討した特徴量を用いた、オンライン機械学習による回答抽出法の検討を行った。しかし、従来の人手でチューニングした評価式を用いる手法を改善するには至っておらず、更なる検討が必要である。以上、これまでに開発した事実型、非事実型、発掘型の質問応答の質問入力部を統合し、すべての回答タイプに対応する質問応答システムの仮実装を行った。 また、開発した質問応答システムについて、ニュース音声・学会講演音声などの音声ドキュメントを対象とするための技術開発を行った。テキストを対象とする場合と異なり音声データを対象とする場合には、(1)音声データから検索語の出現位置を検出する技術、(2)検出した検索語を手がかりに回答を含む音声区間を週出する技術、が必要である。(1)について、距離空間上の索引を用いる全く新しい音声ドキュメントからのキーワード検索手法を開発した。従来法と比べて、閾値を使わずに尤もらしい候補から検出するという特長がある。(2)について、音声ドキュメントの可変長音声区間を対象とする内容検索手法を複数検討し、評価実験により有効な手法を検証した。
|