2009 Fiscal Year Annual Research Report
長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究
Project/Area Number |
19700172
|
Research Institution | The University of Tokushima |
Principal Investigator |
柘植 覚 The University of Tokushima, 大学院・ソシオテクノサイエンス研究部, 講師 (00325250)
|
Keywords | 音声認識 / 特定話者の話者内音声変動 |
Research Abstract |
本研究は、同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならないという問題を取り扱うものである。このような音声認識結果が異なるシステムは毎回利用者がシステムに対し、気を使いながら発声しないといけないため、利便性が低くなる。音声認識結果が異なる原因は、個々人が同一内容を発声したとしても、気分や発声環境の違いにより同一話者の音声が変動(音声変動)してしまうことである。本研究では、この音声変動の要因などを解明し、音声変動による音声認識結果の変化を抑制することを目標に行っている。 平成21年度では、音声変動の調査をするデータベースの構築および孤立単語音声認識における音声変動の調査を行った。 音声収録は男女計6名が終了しているが、本年度では男女計2名の1年分の音声データを切り出し、実験に使用できるようにした。 これらの音声データを用い、特定話者に対する短単語音声認識実験を行い、話者内における音声変動による音声認識結果の変動を調査した。調査結果より、音声変動が影響を及ぼす単単語は特に短い単語であることが解った。特に発声開始が無声音である単語に関しては音声変動により、音声認識結果が異なる傾向が強いことがわかった。来年度は、これらの結果に対する詳細な分析を行い、音声特徴量レベルで比較を行い、音声変動が音声特徴量に及ぼす影響を軽減する手法を検討する予定である。
|