研究概要 |
合成音声を長時間用いてオフィスあるいは静かな部屋(利用環境)で校正作業を行う(利用目的)のに適した,合成音声の声質について調べた。調べた声質の条件は,音声の平均基本周波数とスペクトルの傾斜特性である。正常な聴力を有する15名の被験者について実験したところ,利用環境の違いにかかわらず平均基本周波数は約215Hzが最も適しているが,一方スペクトル傾斜特性は,静かな部屋(20dBA)では高周波数域でエネルギーが弱い,即ち傾斜が大きい方が適しているが,オフィス環境(50dBA)では比較的大きい場合,即ち傾斜が小さい場合も同程度に適合性が良いと判断された。このことから,利用環境に適した合成音声の声質が存在することがわかった。 合成音声を長時間の校正作業で用いる場合と,短時間の間にニュース情報として聴く場合(利用目的)で,それらに適した平均基本周波数という声質の条件がどのように変化するかについて調べた。正常な聴力を有する20名の被験者に実験を行った結果、長時間の校正作業には平均基本周波数が低い方が適しているが,短時間のニュース情報の聴取では,それより高い平均基本周波数の音声が好まれることがわかった。 以上のことから,合成音声の評価には利用目的・利用環境による声質の効果についても考慮する必要があることが明らかになった。
|