研究課題
これまで加法性雑音下音声認識評価基盤(CENSREC-1, 2, 3)を多く収集したが、乗法性雑音下音声認識評価用のデータベースの評価基盤CENSREC-4を作成し、国際会議でも一般公開に至った。本DBには8種類の実環境で収集した残響(=乗法性雑音)をクリーン音声に畳み込んでシミュレートされた残響下音声、およびそのうち4環境では実際に人間がその場で発声した実音声も収録した。また、それらを効率的に除去して音声認識率を向上させる方法についても研究を行った。また、雑音下で音声が変形するロンバード効果についても分析し、3種類の性質の異なる雑音下においてさまざまなSNRのもとでのロンバード音声収録を行った。そして、第2フォルマントへの影響が大きいなどの独特の性質を見出した。さらに、雑音下で音声が使えなくても認識可能な映像も同期収録したデータベースの構築を進めている。これらも本研究期間中にCENSREC-AVとして公開予定である。また、雑音や残響の音声認識への影響を分析し、それらを測る評価指標の改良を引き続き行っている。これによってDBの雑音の被服率や、事前の雑音の性質把握などを可能にできるようなりつつある。を考案し、事前に音声認識への影響を推測する方法の研究を行い、効果を得た。これとは別に、音楽などの非定常性が非常に高い雑音に対する分析および抑圧方法も検討を開始し、一定の効果を得た。今後これらの性質を明らかにしてより一般的なDB構築や手法考案に向けての研究を開始したといえる。
すべて 2009 2008
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (18件)
Acoustical Science and Technology (未定掲載決定)