2007 Fiscal Year Annual Research Report
Project/Area Number |
18652040
|
Research Institution | Wakayama University |
Principal Investigator |
入野 俊夫 Wakayama University, システム工学部, 教授 (20346331)
|
Co-Investigator(Kenkyū-buntansha) |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
高橋 徹 和歌山大学, システム工学部, 研究員 (30419494)
|
Keywords | 音声信号処理 / 音声認識器 / 聴覚心理実験 / 模擬難聴 / 単語知覚 |
Research Abstract |
劣化させた音声を聞き取る時の知覚特性と、音声認識器での認識結果を対比させることにより、人間の音声言語知覚の特性を数理的に定量化することを目的としている。 本年度は、対比に不可欠な人間の知覚特性の基礎データを収集した。前年度の結果として、人間でも音声認識器でも、劣化の度合いや単語親密度に関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いというデータが得られた。この結果は、親密度に関わらず、そもそも日本語の単語に音節系列に統計的な偏りがあることを示している。そこで、知覚特性をさらに詳しく探るために、単音節を一定間隔で4つ並べた4モーラの単音節系列を2種類準備した。1つ目は、データベースの単語の系列をそのまま単音節系列の並びとし、元の単語から音節間の調音結合や音律情報を排除したものである。2つ目は、4つの単音節をランダムに並べ、日本語としての音節系列の統計的な偏りまで排除したものである。これらの4モーラ単音節系列について、通常単語実験と同条件で劣化音合成し、健聴者による聴取実験を行った。この結果、単語単音節系列で見られるモーラ順番による認識率の違いは、ランダム単音節系列の場合は無くなった。このことから、明示的に単語を知らなくても、単語中の音節遷移の統計的な偏りの知識も人間が活用していることが明確になった。この結果を受けて、この実験とまったく同じ状況で音声認識器を走らせる準備を行った。 また、健聴者が難聴者の聞こえを体験できる模擬難聴を実現するため、健聴者の劣化音声知覚と難聴者の通常音声知覚の間のマッピング関数を求めることを開始した。これも音声知覚特性の解明につながる別アプローチである。劣化条件と異聴表データに対して線形多変量解析を行った。冗長性削減のため主成分分析等も援用したが妥当な関数はまだ見つからなかった。
|
Research Products
(4 results)