本研究の目的は、高い予測精度と利便性を持った音声明瞭度(了解度)予測法を確立することである。前年度に提案したGEDIに関する研究を進めていく上で、「非定常な雑音下では音声了解度の予測精度が低下する」という新たな問題が明らかになった。そのため、本研究では「実環境を想定した非定常なバブル雑音下に対応した音声了解度予測法の開発」を追加課題として,以下の研究を進めた。 (1) バブル雑音下に対応した音声了解度予測法の開発:昨年度に提案したGEDIを多重時間解像度版に拡張した mr-GEDIを提案した。mr-GEDIでは、振幅包絡領域における信号対歪み比 (SDRenv)を計算するという方式はそのままに、変調フィルタバンクの出力を時間波形として抽出し、変調フィルタのチャンネルに依存した時間長の短時間フレームで振幅包絡パワーを計算することでSDRenvを算出する。 (2)提案手法の評価:前年度のピンク雑音環境下に加えて、バブル雑音環境下での主観評価の結果を得るために聴取実験を実施した。また、前年度と同様に古典的なスペクトル減算法や最新のウィナーフィルタ型の雑音抑圧法を適用した強調音声を使用して実験を行った。その後、提案手法と既存の客観評価指標であるGEDI、 STOIやHASPIで客観評価を実施した。結果として、提案手法であるmr-GEDIは、GEDI、STOIやHASPIよりも精度良く聴取実験結果を説明できることを示した。 (3)提案法の評価用パッケージの公開:前年度に提案したGEDIに加えて、今年度に提案したmr-GEDIに関して特許を出願した。その上で、国内外の研究活動を推進することを目的として、GEDIとmr-GEDIをGitHub上にオープンソースソフトウェアとして公開した。 以上の一連の研究成果に加えて、現状での問題点や残された研究課題について自身の博士論文に詳細に記載した。
|