本研究の大きな目的は、人間はどのように音声から発話者の個人性と感情情報を知覚しているのかを解明することです。特に、音声生成の面ではなく、人間の聴知覚メカニズムに基づいた手法で聴覚の面から検討することが特色になります。これまでの検討では、音声の変調周波数上限が低くなるにつれ、話者及び感情の識別率が有意に低下することを明らかにしました。また、音声の変調スペクトログラムとその特徴量は心理データと高い相関を持ち、変調スペクトル特徴が音声の個人性と感情知覚に寄与していることが示唆されました。以上の検討では、非言語情報の知覚における振幅包絡線の変調成分の役割に着目したため、雑音や残響のない環境を想定して、心理実験を行っていました。しかし、実環境では雑音や残響などの外乱が混在しております。このような環境で音声の言語・非言語情報の知覚がどのような影響を受けているかを知ることは音声の変調知覚を知る上で重要なことです。上述の疑問点から、雑音環境、残響環境及び雑音残響環境における雑音駆動音声の個人性及び感情の知覚について検討しました。具体的には、雑音や残響を付加した音声をもとに雑音駆動音声の刺激音声を作成し、話者弁別と感情認識実験を実行しました。実験の結果により、極めて劣悪な状況を除く日常的な音環境では、雑音駆動音声の個人性と感情の知覚が残響や雑音の影響を受けにくいことがわかりました。また、雑音と残響の相互作用は認められませんでした。そのため、話者弁別率ならびに感情認識率を雑音と残響の効果でそれぞれ説明できることがわかりました。雑音と残響が雑音駆動音声の個人性と感情の知覚により影響していない条件が存在し、残響時間と雑音対信号比がある閾値を越えると、雑音と残響の影響が次第に大きくなることが示唆されました。今回の検討により、実環境における音声の変調成分と音声の非言語情報知覚の関係を明らかにしました。
|