研究課題/領域番号 |
17500092
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
秋葉 友良 豊橋技術科学大学, 工学部, 准教授 (00356346)
|
研究分担者 |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
研究期間 (年度) |
2005 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
3,500千円 (直接経費: 3,500千円)
2006年度: 1,300千円 (直接経費: 1,300千円)
2005年度: 2,200千円 (直接経費: 2,200千円)
|
キーワード | オープンドメイン質問応答 / 情報検索 / 音声言語インターフェース / パッセージ検索 / 音声入力検索 / 情報アクセス対話 / 文脈処理 / 質問データベース / 質問サイト |
研究概要 |
1.実世界質問の収集 如何なる質問にも対応するユニバーサル質問応答システムの実現のため、まず、実世界にはどのような質問が現れているかを調査した。Web上で発せられる質問に注目し、ある利用者の書き込んだ質問に対し他の利用者が解答を登録する質問ポータルコミュニティサイトから、「質問」と「回答の集合」を1ペアとして、約119万ペアを収集した。 2.実世界質問の分析 次に、収集した質問の分類を試みた。しかし、質問の与え方は様々で、質問を見ただけでは質問者がどのようなタイプの情報を欲しているかを判断するのが難しいということが分かった。そこで、質問を投げることによって結果として質問者が得られた情報の種類から質問の分類を行った。以降、これを「回答タイプ」と呼ぶ。質問・回答ペア約2000に対し、人手で回答の分類を行いつつ回答タイプの設計を行い、10種類の回答タイプに分類した。 3.システムの実装 収集・分析した基礎データを元に、ユニバーサル質問応答システムの実装を行った。回答抽出のアプローチとして、質問に対する正解らしさを質問内容の一致と回答タイプの一致の2つの指標の組合せで評価し、2つが共に尤もらしい回答を抽出する手法を実装した。そのうち、回答タイプの一致判定には、分類した回答タイプのいずれかであるかを判定する分類器を用いる手法と、タイプ一致の有無を二値分類する手法を検討した。 4.システムの評価 本研究課題開始後の平成18年度には、国立情報学研究所主催の評価型ワークショップであるNTCIRにて非事実型の任意の質問を対象とするQAタスクが開始された。そこで、収集した実世界質問での評価に加えて、ワークショップで配布された質問200問の両方を対象に、システムの評価実験を行った。その結果、評価対象によらずタイプ一致の有無を二値分類する手法が有効であることがわかった。
|