劣化雑音音声とは、1)音声を複数の周波数帯域に分割した上で、2)それぞれの帯域ごとに振幅包絡を抽出し、3)「1)」で分割した周波数帯域ごとの雑音に、「2)」で抽出した振幅包絡を与え、4)最後に「3)」で作った周波数帯域ごとの雑音を合わせた音声のことを指す。このようにして作られる劣化雑音音声は、日本語アクセントの主な音響特徴である基本周波数(F0)を持たないため、それ以外にどのような音響特徴があるのかを検証するのに適している。自身のこれまでの研究により、日本語アクセントは、F0以外にもアクセントに関する音響特徴を持っており、しかも、日本語話者はそれを手がかりとして単語を聞き分けることができることが分かっている。そこで本研究は、聴取実験により、その副次的な音響特徴が何であるかを定量的に示すことを目的とする。
知覚実験では実験協力者には4種類の音声刺激を提示した: a)原音声が男性話者で、矩形等価帯域幅(ERB)が2の劣化雑音音声、b)原音声が男性話者で、ERBが3の劣化雑音音声、c)原音声が女性話者で、ERBが2の劣化雑音音声、d)原音声が女性話者で、ERBが3の劣化雑音音声、の4種類である。分析では信号検出理論を用いて弁別能力d'を計算し、聴者がアクセントをどれくらい正確に同定できたかを検証した。その結果、どの条件においても、聴者はチャンスレベル以上の精度で単語を同定することができた。また、原音声が男性の音声刺激には、ERBによる弁別能力の違いはさほどなかったのに対し、原音声が女性の音声刺激では、2ERBの方が3ERBよりも弁別能力は高かった。本実験で使用した音声刺激の音響分析を行ったところ、第1フォルマントはアクセントに後続する語の方が高かった。さらに、原音声が男性話者の音声刺激については、母音の時間長がアクセントを聞き分ける手がかりとなっている可能性が示唆された。
|