2010 Fiscal Year Annual Research Report
長・短期間の音声変動の解明および音声変動に頑健な音声認識手法に関する研究
Project/Area Number |
19700172
|
Research Institution | The University of Tokushima |
Principal Investigator |
柘植 覚 大同大学, 情報学部, 准教授 (00325250)
|
Keywords | 音声認識 / 特定話者の話者内音声変動 |
Research Abstract |
本研究は、同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならないという問題を取り扱うものである。このような音声認識結果が異なるシステムは毎回利用者がシステムに対し、気を使いながら発声しないといけないため、利便性が低くなる。音声認識結果が異なる原因は、個々人が同一内容を発声したとしても、気分や発声環境の違いにより同一話者の音声が変動(音声変動)してしまうことである。本研究では、この音声変動の要因などを解明し、音声変動による音声認識結果の変化を抑制することを目標に行っている。 平成22年度では、音声変動の調査をするデータベースの構築および孤立単語音声認識における音声変動の調査を行った。男性話者1名に対する2年分の音声を取り扱い、各発声動詞の類似度をDPマッチングにより計算し、時期、時間帯などの異なりによる音声の変動状況を調べた。 この結果および音素認識実験結果を基に適応手法を検討する予定である。
|