2008 Fiscal Year Annual Research Report
Project/Area Number |
18652040
|
Research Institution | Wakayama University |
Principal Investigator |
入野 俊夫 Wakayama University, システム工学部, 教授 (20346331)
|
Co-Investigator(Kenkyū-buntansha) |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
|
Keywords | 音声信号処理 / 音声認識 / 聴覚心理実験 / 模擬難聴 / 単語知覚 / 単語親密度 / 音声明瞭度 |
Research Abstract |
劣化させた音声を聞き取る時の知覚特性と、音声認識器での認識結果を対比させることにより、人間の音声言語知覚の特性を数理的に定量化することを目的としている。 本年度は、H19年度に収集した人間の知覚特性データと対比するために、同一の単語音声データ(FW03)を用いて、音声認識実験をH18年度に行ったものより改善して実施した。まず認識系を最も標準的なHTK(http://htk.eng.cam.ac.uk/)とした。また、人間の知覚実験に用いた1話者分だけでなく、FW03中の他の話者に関しても、音韻ラベルを自動的に付け、学習データを1話者から4話者までとした場合のそれぞれの認識結果も出すことができるようにした。得られた結論として、音声認識器でも、劣化の度合いや単語親密度に関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという、人間と同じ傾向のデータが得られた。劣化度合いが大きい場合、人間も認識器と同様に音節遷移情報にかなり依存していた。これに対し、劣化度合が小さい場合には、人間の認識率は認識器の認識率より優れていることがわかった。また、異聴表を対比させて両者を比較した。認識器の場合は、劣化度合の変化に関わらず異聴傾向はそれほど変化せず、人間のばらつきのある結果と対照的であった。今後さらに、認識用の特徴ベクトルの選択や、人間の高次認知的な振舞いに関して検討の余地がある。 従来、音声明瞭度試験は単音節で行われてきたが、日常会話音声の知覚特性は必ずしも明確ではなかった。今回使用した親密度統制単語音声リストFW03(FW07)は、そのために開発され、活用が期待されている。しかし、その単語音声自体が持つ統計的/定量的な特性把握はまだ行われていなかった。本研究はその第一歩で、今後の音声知覚研究の基盤となるものと考える。
|
Research Products
(3 results)