2008 Fiscal Year Annual Research Report
ドメイン独立な話し言葉のモデル化に基づく音声認識の研究
Project/Area Number |
18700177
|
Research Institution | Kyoto University |
Principal Investigator |
秋田 祐哉 Kyoto University, 学術情報メディアセンター, 助教 (90402742)
|
Keywords | 音声認識 / 言語モデル / 発音モデル / 話し言葉 |
Research Abstract |
平成20年度では, 話し言葉の言語的特徴や話し言葉変換のモデリングの分析と, 音声認識におけるさらなる性能評価を課題とした. (1) 話し言葉のモデリングの分析 本研究では, 話し言葉に特徴的な表現とその発生条件(文脈)・頻度・比率などをモデル化し, これに基づき音声認識用言語モデルの変換を行っている. 平成20年度では, モデリングに利用する話し言葉のテキストデータ量を増加させてモデルを評価した. この結果, これまでの比較的少量のデータでも妥当なレベルのモデルが得られていることが分かり, 少量のデータでも適用可能という提案法の効率性の高さを確認するこができた. (2) 話し言葉変換モデルを用いた音声認識 (1) による話し言葉変換モデルについて, 音声認識に対する有効性を検証した. 平成20年度では, より精密で大規模な(文脈の長い)言語モデルに対して提案法を適用した. 提案法はこのような言語モデルでも機能し, 言語予測性能と実際の音声認識性能をいずれも改善した。また, これまでとは異なるデータにおいても評価を行い, やはり音声認識性能の改善を得た.これらにより, 提案法が話し言葉音声認識において安定的に機能することを実証した. 本研究の成果に基づき構築された国会音声認識システムは, 実用的な水準の性能に達しつつある状況である. これらの成果について, 国内の研究会等における発表や論文誌への投稿などを行っている.
|