2008 Fiscal Year Annual Research Report
高度な情報検索システムのための認識誤りの質に着目した音声認識戦略
Project/Area Number |
18700188
|
Research Institution | Ryukoku University |
Principal Investigator |
南條 浩輝 Ryukoku University, 理工学部, 助教 (50388162)
|
Keywords | 声音認識 / ベイズリスク最小化 / 探索アルゴリズム / 情報検索 / 単語重要度 |
Research Abstract |
音声入力型の情報検索および音声を検索対象とした情報検索において, 検索に対する影響が大きい単語やフレーズの音声認識誤りを重要視する音声認識について研究を進めてきた. 具体的には以下の課題を実施した. 1. 重要単語とその重要度の自動推定 情報検索に影響が大きい単語やフレーズとその影響(重要度)を自動で推定するための研究を行った. 音声入力型の情報検索において, 入力音声とその書き起こしの2者が得られる場合の単語重要度の自動推定手法(半教師なし推定)を提案した. 推定した単語重要度を用いたベイズリスク最小化音声認識により, 音声入力型情報検索において音声認識および検索精度の向上が得られた. さらに, 入力音声およびその書き起こしを用いない教師なし推定手法を考案した. 2. 音声ドキュメント検索タスクへの適用 音声入力型の情報検索だけでなく, 検索対象を音声とする情報検索においても研究を行った. 具体的には講演音声の検索(講演音声ドキュメント検索)で研究を行った. 重要文抽出検索タスクで提案手法の効果を示した. さらに大規模な実験を行うために共通的実験データベース(音声ドキュメント検索テストコレクション)を整備し, ベースライン検索性能を示した. その上で索引語が検索に与える影響についても調査を行った. 3. 得られた成果の公開 得られた成果を論文誌等で公開した. 未公開分は公開準備中である. データベースやプログラムに関しても公開・配布に向けて準備を行っている.
|