Research Abstract |
本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.一般に,骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は次の二点を行った. (1)データベース構築 骨導音声の特徴・伝達関数の特性を明らかにするために,様々な条件(話者の違い,測定点の違い,発話内容の違いなど)における気導音と骨導音のペア収録を行い,大規模な音声データベースを構築した.骨導音は,二種類の骨伝導マイクを利用し,10名の被験者からデータ収録を行った.発話内容は日本語音韻だけでなく,NTT-AT親密度別了解度試験用音声データに従うものとした. (2)伝達特性の分析ならびにモデル化の検討 (1)で構築した気導・骨導音声データベースから様々な条件での気導音・骨導音の特徴ならびに伝達特性を分析し,変調伝達関数と比較したときの適合度合いを調査した.主に利用した尺度は,相関,SN比,パワー比,MTF,LPCである.伝達特性の分析の後,その伝達逆特性を実現するために,分析結果に基づいた二種類のエンベロープ回復処理(MTFに基づいたものとLPC法に基づいたもの)を利用して,骨導音声の明瞭度を回復する計算モデルを構築した.回復法について主観評価(MOSテスト)ならびに客観評価(LSD,LCD,MCD)を行ったところ,FFTやクロススペクトル法を用いた単純な逆特性を推定する方法よりも,提案法が骨導音の明瞭度をかなり回復できることを示した.
|