Budget Amount *help |
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2005: ¥1,400,000 (Direct Cost: ¥1,400,000)
|
Research Abstract |
本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は,昨年度提案したプロトタイプモデルの改良を行うとともに,提案モデルについて二つの評価検討を行った. 1)骨導音声回復法の改良 線形予測(LP)法に基づいたプロトタイプモデルについて,骨導音声と気導音声間でLP残差がほぼ一定であること,LP係数を逆推定可能であること,ならびにより安定なLP表現上のLSF係数を逆推定可能であることを利用して,モデルを改良し,完全なたブラインド回復法を提案した.逆推定にはニューラルネットワーク等の学習法を利用した. 2)客観評価による検討 提案モデルを定量的に評価するために,昨年度構築した骨導・気導音声を評価データとして利用した.客観評価尺度としてスペクトル歪,LPC距離,MFCC距離を利用し,LP法ならびにLPベースのブラインド回復法が有効に骨導音声を気導音声並みに回復できることを示した.この成果は骨導音声に対する音声認識の前処理として利用可能であることを実証している. 3)主観評価による検討 同じく主観評価として,MOSテスト,改良Rhymeテスト,単語了解度試験を行った.改良Rhymeテストでは英語音声データに対してのみ,単語了解度試験では日本語音声データに対してのみ,MOSテストでは両データに対して行った.その結果,提案法が観測した骨導音声のみから,いずれも骨導音声の低下した音質や音声明瞭度を著しく改善できることを示した.
|