2005 Fiscal Year Annual Research Report
実環境における音源分離と分離音認識を統合したロボット聴覚
Project/Area Number |
05J50562
|
Research Institution | Kyoto University |
Principal Investigator |
山本 俊一 京都大学, 情報学研究科, 特別研究員(DC1)
|
Keywords | ロボット聴覚 / 音源分離 / 音声認識 / ミッシングフィーチャ理論 / 同時発話認識 / 遺伝的アルゴリズム / 音源定位 / 発話区間検出 |
Research Abstract |
初年度は,これまで開発してきた同時発話認識システ云の高精度化,高速化を行った.開発した同時発話認識システムを,ヒューマノイドロボットSIG2だけではなく,ヒューマノイドロボットRobovie-R2での評価実験を行った. 1.音源分離と音声認識を統合した同時発話認識システムの遺伝的アルゴリズムによる最適化 同時発話認識システムの精度向上のために,遺伝的アルゴリズムによって認識する環境にシステムを最適化する手法を開発した.音源数、ロボットから見た音源の方向・距離の様々な組み合わせに対して最適化し、同時発話認識システムの認識精度が向上することを確認した.IEA/AIE2006(フランス,6/27〜30)にて成果発表予定.ヒューマンインタフェース学会へのジャーナル論文採録決定. 2.実環境における同時発話認識システムのリアルタイム処理の実装 開発した同時発話認識システムをさらに改良した.まず,遺伝的アルゴリズムによって最適化したパラメータを話者の位置によって最適なパラメータを選択できるようにした.次に,実環境で利用できるようにするために発話区間検出を実装した.最後に,音源定位,音源分離,最適パラメータ選択,発話区間検出,特徴量抽出,ミッシングフィーチャマスク自動生成の各モジュールを統合しシステムの高速化を行った.同時発話認識実験により最適パラメータ選択,発話区間検出それぞれによって認識精度が向上することを確認した.また,Pentium4 2.4GHzのパーソナルコンピュータ上で,リアルタイムに同時発話認識システムが動作することを確認した.IROS2006(北京,10/9〜15)へ投稿中.
|
Research Products
(4 results)