研究課題/領域番号 |
25330182
|
研究機関 | 山形大学 |
研究代表者 |
近藤 和弘 山形大学, 理工学研究科, 准教授 (10312753)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 音声了解度 / 推定 / 二者択一 / 雑音 / 音声特徴量 / Articulation Index Band |
研究実績の概要 |
携帯電話、IP電話等の普及で様々な音質、環境での音声通信が行なわれるようになってきているが、このような多様な環境下では必ずしも目的に合致した音声通話品質が確保されているとは限らない。特に音声の通信においては正確に発話内容が相手に伝わることが重要であり、音声了解度がこれを測る最も適切な尺度である。しかし、音声了解度の測定には多数の被験者を用いて相当量の音声標本を評価することが必要である。そこで、本研究では実際通信中の音声信号より了解度に関連する特徴量を算出し、この特徴量からあらかじめ学習した対応関係から了解度を高精度で測定することを目標とした。 本年度は報告者が提案している二者択一型の了解度試験法の了解度において、その二者択一の様式を忠実に反映した了解度推定方法を検討した。特徴量として人間の聴覚特性を考慮した帯域別の単語音声テンプレートと劣化音声のスペクトルの相関値を用いた。ここでテンプレートとして用いる単語は二者択一の単語対とし、相関を候補単語のテンプレート両方について求め、相関値の大きい単語を候補単語と判定する。この候補単語と実際劣化音声に含まれる音声の一致精度より了解度を推定する。 従来の推定方法が劣化音声とテンプレート音声の信号対雑音比だけから了解度を推定していたのに対し、本方法では単語対の双方の単語との一致を直接比較することで、より被験者の聴取過程を忠実に再現していることになるため、推定精度の向上が期待できる。実験の結果、未知雑音混入音声に対し被験者が実際評価した了解度と推定了解度間の相関は0.93以上、平均2乗誤差は0.14程度となった。これは従来方法に比べ極めて優位な結果である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
未知雑音混入音声に対し、被験者が評価した主観音声了解度と推定了解度間の平均2乗誤差を0.1程度、相関を0.9程度を目標としてきた。これに対し、今回の提案では相関は0.93以上、平均2乗誤差は0.14程度であり、ほぼ目標を達成できた。以上により提案方式の効果は確認できたと考える。物理量としてスペクトル相関以外の距離尺度を用いることで、さらに改善が見込める。
|
今後の研究の推進方策 |
引き続き距離尺度を最適化し、さらに推定の平均2乗誤差の低減を目指す。 (1) 距離尺度として、すでに主観量と相関の高いことが分かっている周波数重み付信号対雑音比を用いることを検討する。この量を候補単語間で比較して推定単語とすることで、推定精度の向上を目指す。 (2)立体音響の了解度推定への拡張を目指す。音声了解度は音声の再生位置と騒音減の位置の相対関係の影響を受けることが知られている。これを利用して各音源位置による了解度への影響を学習し、未知音源位置に対しても了解度を推定する方法を検討する。
|
次年度使用額が生じた理由 |
旅費に関しては有力学会の開催が今年度はアジア地区で多く開催されたため、航空運賃が当初見積もりより少なく済んだことによる。 物品費に関しては当初購入予定にしていた音質評価ソフトの導入を見送り、自作としたため、当初見積もりより少額になっている。
|
次年度使用額の使用計画 |
旅費は今年度は有力国際学会がヨーロッパで開催されるため、航空運賃、宿泊滞在費が昨年より大幅に増加することが考えられるので、これに充てる。 物品費に関しては、蓄積データ量(音声標本)が大分増加したため、ファイルサーバを導入して安全かつ高速なデータ共有を実現し、研究効率の向上を図る。
|