Research Abstract |
本研究では, 室内伝達特性と音声明瞭度に関連づけられた変調伝達関数に着目することで, 室内伝達特性を測定することなく, ブラインド的にかつ適応的に残響音声の回復を可能とする手法を提案した, また, 実時間処理への応用を狙ったプロトタイプモデルの構築を目指し, 次の手順で研究を実施してきた. (1)適応的な残響回復処理の実現, (2)残響回復と明瞭度改善の効果の対応づけ, (3)実環境での評価と耐性ならびにモデルの洗練化,(4)総合評価. ここで, 残響回復のための基本処理方式は, 決められた時間一周波数分割幅に基づいて残響音声を時間・周波数分割し, その上でエンベロープとキャリアに分解する. その後, それぞれの特徴から残響の影響を取り除き, 再度, 時間波形に復元することで残響回復を可能とする. 最終年度である本年度は, まず, 課題(1)と(2)で残された課題に取り組んだ. 前者に関しては, キャリアの再生成法(FO推定と有声・無声判定を含めたVAD処理)を再検討し, 改良法を考案した. また, 残響回復で重要なパラメータである残響時間の高精度な推定法を実現した. 後者に関しては, 処理方式による残響音声の回復度合い(明瞭度の回復, 残響感の低減)を聴取実験と, 大規模計算機シミュレーションによる評価(PESQ, LSD, WSS, LPC距離, LLR, 明瞭度重み付LSDなどを利用した回復評価)により検討した. 課題(3)では, 人工残響付与装置による任意の残響インパルス応答や実測の残響インパルス応答の大規模データベースを利用し, 残響環境を計算機上に再現して, 提案法の評価を行った. 最後に, 課題(4)の総合評価として, 提案手法が実環境で音声認識等にも有効に機能することを確認するために, 残響環境下での音声認識評価実験も行った. これらの結果, 提案法が音声明瞭度だけでなく音声認識率の回復に対しても有効であることがわかった。
|