研究課題/領域番号 |
22300059
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 大学院・工学研究科, 教授 (20115893)
|
研究分担者 |
秋葉 友良 豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)
山本 一公 豊橋技術科学大学, 大学院・工学研究科, 助教 (40324230)
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
|
キーワード | 音声認識 / 音声整形 / 音声要約 / HMM / トピック依存言語モデル / nグラムインデックス / 音声検索 / 未知語 |
研究概要 |
音声情報の有効活用のためには、高精度な音声認識法、認識結果を読み易くするための音声整形法、音声要約法、大量の音声ドキュメントからの検索キーワードの高速検索法の技術開発が必要である。 本年度は、現在の世界的標準となっている音声認識モデルであるHMMを包含する隠れニューラル確率場モデルによる音声認識技術を開発し、HMMと同等以上の性能を得る見込みを得た。音声認識の言語モデルに関しては、音声認識対象単語の直前の数十単語のコンテキストを用いてトピックを同定し、トピックに依存した言語モデルによる音声認識法を開発し、パープレキシティの減少、音声認識の向上を達成した。また、認識辞書に登録されていない未知語に対する言語モデルの構成法を提案し、有効性を示した。 音声ドキュメントの高速検索法として、音声認識の置換誤り、挿入誤り、脱落誤りに頑健な音節のnグラムインデックスによる方法を提案し、その有効性を示した。検索精度の向上を図るために、音節認識結果のmベストを利用する方法を提案した。基本的な手法である音節列向上の連続DPマッチング法と比較し、約200倍の検索速度で同等以上の検索精度を得られることを示した。本手法は、音声認識誤りや音声認識用辞書に登録されていない未知語に対しても頑健に動作する。
|