2006 Fiscal Year Annual Research Report
Project/Area Number |
18652040
|
Research Institution | Wakayama University |
Principal Investigator |
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
|
Co-Investigator(Kenkyū-buntansha) |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
西村 竜一 和歌山大学, システム工学部, 助手 (00379611)
高橋 徹 和歌山大学, システム工学部, 研究員 (30419494)
|
Keywords | 音声信号処理 / 音声認識器 / 聴覚心理実験 / 模擬難聴 / 単語知覚 |
Research Abstract |
本年度は、我々がすでに実施してきた劣化音声の知覚実験の結果と対比するべく、劣化音声を入力とした音声認識実験を実施した。この知覚実験は、高音質分析合成法STRAIGHTを用いて作成した劣化音声を健聴者に聞かせて、聞き取れた通り仮名表記で答えさせたものである。この劣化音声は、STRAIGHTスペクトルを、周波数方向・時間方向・時間周波数両方向平滑化したのち合成して得た。使用した単語は4モーラで、親密度が最も低いグループより選び、明示的な言語知識を極力使えないようにした。 これと同様な認識実験を、音声認識ソフトJulianを用いて行った。まず単語音声を、聴取実験と同様にそれぞれの劣化条件に合わせてSTRAIGHTを用いて劣化させた。それから得られた音声特徴量MFCC係数と音韻ラベルを用いて音声認識器を学習させた。また、予備実験により親密度の影響がないことを確認した上でデータベース中の全単語を用いて学習データ数を増やし、さらに劣化条件ごとに学習データを準備して、クローズド実験とオープン実験の両方を行った。この結果、音声認識器の認識率と人間の認識率では、想定していたとおり傾向は異なった。特に異なるのは、劣化条件が緩やかな場合で、むしろ劣化条件が厳しい条件では似た傾向を示すようになることもわかった。これに対して人間と共通な特性として、劣化の度合いに関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという結果が出てきた。これは、日本語単語内における音節系列の統計的な偏りによるものであると考えている。 この認識実験と平行して知覚特性の基礎データを得るため劣化音声の聴取実験も、単語の提示音圧レベルを低減した場合や、調音結合を排除するために単音節を4つ並べて単語とした場合について実施した。また、健聴者の劣化音声知覚と難聴者の通常音声知覚の対比を行うために、弁別素性を元にした異聴傾向の把握も行った。
|
Research Products
(2 results)