研究概要 |
研究目的は,ヒューマノイドロボットが,音声を実環境下で高精度に認識するための身体制御方法開発である.ロボット動作中でも認識可能な他,雑音としての音声が存在しても,目的とする音声を認識することが目標である.現在開発・改良している音源定位・音源分離・分離音声認識ソフトウエアを用いて音源認識ロボットの身体制御方法を開発している. 22年度計画は,ロボット動作中の音声認識の実現であった.ロボット動作中には,ロボット動作音(例えばファン音)があるため,その音は,音声認識にとって雑音となる.電源投入時のファン音など,待機時の雑音は,特定方向からの音源となる.従来方法では,雑音を音源定位し,音源分離できなかったが,特定方向の音源を無視する仕組みを導入することで動作中の認識が可能になった. 異なるマイクロホンアレイを用い,ロボットに音声認識機能を実現することも目的であった.ECMマイクロホンを搭載したヒューマノイドロボットHRP-2と,MEMSマイクロホンを搭載したロボットRobovie-R2に音声認識機能を構築した.一般にMEMSマイクロホンは,小型で個体間のばらつきが小さく,マイクロホンアレイを構成するのに適している.開発したソフトウエアは,マイクロホンの種類によらず,ロボット聴覚機能を実現可能であることを示した.また,ソフトウエアがロボット形状に対して柔軟に適応可能であることを示した. 移動音源でロボット静止中の音源定位・音源分離,または音源静止中でロボット移動中の音源定位・音源分離には,音源分離行列の適応処理が,可能な限り早く収束することが求められる.高速に収束する方法を開発し,収束時間に比べ,音源またはロボットの移動速度が遅い滑らかな移動であれば,移動中の音源定位・音源分離が可能となった. 身体動作・移動を伴う認識性能改善は,今後の課題である.
|