研究概要 |
平成19年度はヒューマノイドの開発と要素技術の開発・洗練化に取り組んだ. (1)上半身ヒューマノイドHRP-2の開発:カメラは3眼,無指向性マイクロフォンは8本を頭部に,音響信号は無線型AD装置で取り込むこととし,3月末に納品された. (2)実時間ロボット聴覚ソフトウェア"HARK"の開発: ・8本のマイクロフォンによる音源定位・分離法・音声認識の統合ソフトウェアを洗練化し,オープンソース化を準備.http://winnie.kuis.kyoto-u.ac.jp/HARK/で公開.3話者同時発話認識(料理注文,口によるジャンケンの審判)のデモを開発し,HARKの移植性の高さを実証. ・バージイン発話を可能にする独立成分解析によるセミブラインド分離とミッシングフィーチャ理論による同時発話認識技術を開発.IEEE/RSJ IROS-2006 Best Paper Finalistに選定. ・音楽を聴いてビートを実時間で認識し,足踏みをしたり,ビートを声を出して数える音楽ロボットを開発.セミブラインド分離による自己発声抑制機能の有効性確認. (3)マイクロフォンアレイ及びカメラアレイを用いた話者追跡アルゴリズムの開発:本手法は,浅野らが開発した話者数推定手法をパーティクルフィルタの枠組みに導入したものであり,話者数が動的に変化する環境に対してもロバストに話者追跡が可能. (4)ロボットの他者の発見とその行動模倣:RNNPBにより学習で獲得した視野変換機能を通じて,相手の行動を自己モデルに変換することにより他者の行動を模倣する機構を開発し,他者の意図理解の技術基盤を確立. (5)マルチドメイン音声対話システムの高性能化:WFSTに基づくラピッドプロトタイピング向け音声言語理解手法を開発するとともに,ユーザの想定外発話からユーザ意図を推定する機能を開発し,その有効性を確認.
|