本研究は、同一発声者が特定の音声認識(話者依存音声認識)システムを使用した場合においても必ず毎回同一の音声認識結果とならないという問題を取り扱うものである。この個々人が同一内容を発声したとしても、気分や発声環境により変動(音声変動)する原因を解明し、音声認識精度の変動を抑制することが本研究の目的である。 平成20年度では、音声変動の調査をするデータベースの構築を行い、話者3名の約3年分のデータ処理を行った。データ処理の際に多大な労力と時間が必要となるため、この時間軽減のためにデータベース作成支援ツールに関する研究を行った。 また、データベース処理が終了した音声データに対し、音声認識を行い話者適応の有効性について検討した。
|