2006 Fiscal Year Annual Research Report
高度な情報検索システムのための認識誤りの質に着目した音声認識戦略
Project/Area Number |
18700188
|
Research Institution | Ryukoku University |
Principal Investigator |
南條 浩輝 龍谷大学, 理工学部, 助手 (50388162)
|
Keywords | 音声認識 / ベイズリスク最小化 / 探索アルゴリズム / 情報検索 / 単語重要度 |
Research Abstract |
音声入力型の情報検索システムにおける音声認識戦略について研究を進めてきた.具体的には,情報検索に致命的な影響を与える単語やフレーズの誤りを重要視し,そのようなものの誤りを最小にする音声認識戦略について研究を進めてきた. はじめに,情報検索のための音声認識戦略においては,従来の「音声認識誤りの量」に着目した戦略ではなく,「音声認識誤りの質」に着目する新たな戦略が必要であることを示し,その実装を行った.具体的には,音声認識の評価尺度として,単語ごとに異なる重み(重要度)を与えた尺度「重みつき単語誤り率」を定義し,それを最小化する(重要単語の誤りを最も少なくする)音声認識手法をベイズリスク最小化の枠組みに基づいて実装した.ベイズリスク最小化音声認識を高精度に行うための認識アルゴリズムとして,種々のアルゴリズムを実装・比較し,コンフュージョンネットワーク型のグラフ探索アルゴリズムの有効性を確認した. 次に,講演の音声を認識し,その認識結果から重要文を抽出(検索)するタスクにおいてベイズリスク最小化音声認識の評価を行った.検索キーワードに当該キーワードの検索時の重要度を与えてベイズリスク最小化音声認識を行うことで,重要単語の誤り(重みつき単語誤り率)の改善および重要文抽出精度の向上を得た. また,種々のタスクで提案手法の評価を行うため,標準的なWEB検索システムおよび音声ドキュメント検索の準備を行った.今後は,重要単語とその重要度を自動で決定する手法について研究を進め,さまざまなタスクで評価を行っていく予定である.
|