研究概要 |
本年度は,前年度の研究成果である,「実環境からの音響情報の取得に分散配置型多点受音マイクロホン収録系を用い,同定すべきシーン内の音響情報を様々な場所で観測することにより,よりロバストな音声認識を行うための技術」について,引き続き詳細な検討行った. スペースダイバーシチ型音声認識の基本的な考え方は,残響や妨害雑音のある劣悪な音響環境下で発声された音声を様々な地点で観測し,その中から何らかの基準に従って信頼度の高い情報を得ることにより,高精度な音声認識を行うというものである.このようなシステムの実現には,(1)マイクロホンから離れた位置で発声される遠隔音声の認識手法の開発,及び(2)認識器へ入力される複数のチャネル情報の統合もしくは選択手法の開発,が求められる.本論文では,遠隔音声の認識手法として,ある観測点での室内伝達特性を畳み込んだ音声を用いて学習した遠隔音声モデルを複数地点分用意し,用いる.また,複数チャネル情報の統合/選択手法として,尤度レベル,特徴量レベル及び信号レベルでの統合/選択手法を提案する.実験結果より,分散配置マルチマイクロホンによるスペースダイバーシチ型音声認識手法により,83.6〜88.7%の認識精度が得られることが分かった. 以上の研究成果報告は,IEEE主催の音声・音響・信号処理国際会議及び電子情報通信学会論文誌で行った.
|