2008 Fiscal Year Annual Research Report
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
Project/Area Number |
19650040
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 Toyohashi University of Technology, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
山本 一公 豊橋技術科学大学, 工学部, 助教 (40324230)
土屋 雅稔 豊橋技術科学大学, 工学部, 助教 (70378256)
北岡 教英 名古屋大学, 大学院・情報科学研究科, 准教授 (10333501)
|
Keywords | ハンズフリー / 音声認識 / 遠隔発話 / 発声方向 / 音源位置 / マイクロフォンアレイ / ニューラルネットワーク |
Research Abstract |
平成19年度の成果をもとに、分散配置したマイクロフォンアレイを用いた遠隔発話の認識方法を検討した。 リビングルームを想定した比較的大きな部屋(5m×6.4m×2.65m)で、マイクから離れた位置で発声した音源位置の同定実験を行なった。T-型マイクロフォンアレイを天井に4箇所、壁に4箇所設置(合計32個のマイクロフォン)し、それぞれのマイクロフォンアレイによってマイク間の到達時間差やパワー比をニューラルネットワークの入力として用いて、音源位置を推定し、得られた8個の推定位置を統合して、音源位置を推定する方法を検討した。 推定された音源位置を利用し、マイク間の時間到達差を再推定し、ビームフォーマーにより音声を強調し、音声認識率を向上を図った。 また、45度ごとの8方向で発声した音声の発声向きの同定実験を行なった。推定は、発話方向45度以内の推定誤差で約95%の精度の8方向の発声向きの同定ができた。これにより、発声方向に関連したリビングルーム内の機器を音声で制御できる見通しを得た。
|