本研究は,音声の物理的な特徴量の保存度に着目することにより,リアルタイムに室内空間における音声品質を評価する方法を開発することである。平成27年度は,音声品質評価を話者に視覚的および聴覚的にフィードバックした際の発話の変化およびそれに伴う音声品質の変化を聴感実験により検討した。 妨害音として騒音を用い,被験者の発話音声と騒音をミックスして受聴点における音声を模擬した。視覚フィードバックとして,リアルタイムで受聴点における音声と騒音の音圧レベル差(SN比)を算出し,その値を棒グラフで視覚提示した。また,音声品質評価の目安として,SN比の下限と上限を棒グラフの色を変えることにより提示した。聴覚フィードバックとして,受聴点における音声をイヤホンを用いて聴覚提示した。以上の視覚フィードバックと聴覚フィードバックのいずれか,あるいは両方を被験者にリアルタイムで提示しながら,定型文を音読させる実験を行った。 その結果,以下を明らかにした。(1) 視覚フィードバックより,聴覚フィードバックの方が発話レベルを上昇させる効果が高く,一定の音声品質評価を得るために必要な発話レベルが大きい状況ほどその影響が強い。(2) 聴覚フィードバックだけでは過度な発話レベルの抑制はできず,視覚フィードバックによる上限提示が必要である。(3) フィードバックを有効利用できるかどうかには個人差がある。
|