携帯電話、IP電話等の普及で様々な音質、環境での音声通信が行われるようになっているが、必ずしも目的に合致した品質が確保されているとは限らない。特に音声通信においては正確に発話内容が伝わっていることが重要であり、音声了解度がこれを測る最も適切な尺度である。しかし音声了解度の測定には被験者を用いて相当量の音声標本を評価することが必要である。この方法では運用中の通信路の品質をモニタすることは不可能である。そこで、実際通信中の音声信号より了解度に関連する特徴量を算出し、この特徴量からあらかじめ学習した対応関係から了解度を高精度で推定することを目標とした。これにより実時間での品質のモニタリングを可能にする方法の確立を目的とした。 (1)電子協騒音データベース内の代表的な騒音を分析し、その音響特性、および音声了解度への影響から3種類程度のクラスとして分類することが妥当であることがわかった。 (2)その3種類を網羅する騒音混入データの物理量と主観了解度間の関係を学習し、この関係を用いて未知騒音混入の音声信号の物理量から十分実用的な精度で了解度推定可能であることがわかった。物理量としては周波数重み付けSNRが最も有効であることが分かった。 (3)さらに騒音源と音声が別方向から到来する場合、両耳の入力信号のうち、SNRが高くなると推定される側の入力より物理量を算出してこれを(2)と同様の推定に用いることで、モノラル音として了解度を推定する場合に比べ、実際両耳聴した主観音声了解度の推定精度を改善できることがわかった。ただし、まだ十分な精度とは言えない段階であり、引き続き精度向上を目指す。 本研究により、想定している外乱の一つである加算雑音に関しては十分実用的な精度で音声了解度が推定できるめどが立った。今後は残響を含む音声の了解度を十分な精度で推定できる方式へ発展させることを目指す。
|