同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならない。このような音声認識結果の異なりは、「さっき認識したのに、なんで今回認識しないのだろう?」というような音声認識システムへの不信感につながり、音声認識が広く一般に普及しない原因の一つとなっている。音声は個人性により大きく変動することもさることながら、個々人が同一内容を発声したとしても、気分や発声環境により変動(音声変動)する。これが認識結果の変動を引き起こす原因となっている。 本研究では、特定話者ならば長期間に渡り、安定した高精度の音声認識ができる音声認識手法の確立を目標とする。申請期間において、科学的側面から特定話者(個々人)の音声が時期、時間、体調、気分、環境などの違いでどのように変動するかを明確にし、これらの音声変動に頑健な特定話者音声認識手法を確立する。
|