2009 Fiscal Year Annual Research Report
実環境下における自然な音声対話の実現ためのロボット聴覚に関する研究
Project/Area Number |
09J02039
|
Research Institution | Kyoto University |
Principal Investigator |
武田 龍 Kyoto University, 情報学研究科, 特別研究員(DC2)
|
Keywords | マイクロホンアレー / ロボット聴覚 / 独立成分分析 / ブラインド音源分離 / ブラインド残響除去 / エコーキャンセラ |
Research Abstract |
《研究目的》自己生成音・残響下におけるロボットとの自然な音声インタラクションの実現 《研究方法》個別に研究されてきた信号処理・音声認識・音声対話を統一的に扱う 《研究進捗》統計的手法をベースに用いて,課題の達成に取り組んでいる. 1.信号処理:当初の予定通り,統計的な音源分離手法である独立成分分析(ICA)を拡張することで,ブラインド音源分離,ブラインド残響除去,ロボット発話分離の同時処理を実現した.関連内容は,ICASSP2009,日本ロボット学会誌で発表をしている.従来では,残響環境下で分離性能が低下する問題があったが,本手法では残響環境下でも高い分離性能達成している.このレベルの分離性能を実現しているロボットは見られない.また,学習係数適応手法を開発することにより,ロボットへの搭載に必要なリアルタイム分離の実現も視野に入った.この内容は,IROS2009で発表している. 2.音声認識:信号処理における進捗が大きかったため,音声認識部分に関しては音声特徴量の信頼度に関する基礎検討のみに留まった.本研究で開発した音源分離で生じる歪みの内,特に対処すべき部分は発話の先頭であることがわかった.発話の先頭は統計量不足のため,十分な分離を達成することが難しく,特徴量信頼度重みを発話時間によって変更すべきであるという知見が得られた.今後は特徴量信頼度を考慮できる音声認識と統合する予定. 3.音声対話:バージイン(割り込み発話)のタイミング情報を利用することで,特定の対話タスク:列挙型音声対話,において雑音環境下での頑健な認識を達成した.従来は音声認識結果のみを利用していたが,発話タイミングという時間情報を統計的な枠組みにより統合することで達成している.この内容は,日本ロボット学会全国大会で発表している.
|
Research Products
(5 results)