Research Abstract |
従来のヒューマノイドと人間とのインタラクションでは,1対1か,複数人であってもロボットからほぼ等距離にいる人とのコミュニケーションであった.本研究では,より柔軟なコミュニケーションのために,対人距離に基づいた複数の人とのインタラクション手法について検討を行った.主な成果は次の通りである. (1)近接学に基づく対人距離に応じたセンサ選択・挙動選択法の開発:ロボット個体ごとのセンサの感度あるいは出力装置の性能から得られた有効距離が近接学の対人距離の定義の主要因とみなし,近接学の4種類の距離を再定義した.具体的には,SIG2の肌センサ,顔追跡,顔認識,音源定位,音声認識の距離依存度を測定した.また,社会・公共距離に対しては超指向性スピーカによる音声出力と話者追跡システムとを組み合わせ,その人に動きに追従する音のスポットライト機能を実現し,インタラクション高度化の可能性を実証した.これらの成果は,国際会議論文とジャーナル論文として発表した. (2)分離音の音声認識精度の向上と高速化:音源分離システムADFPでは,マイクロフォンを2本しか使用していないので,分離音のチャネル間干渉情報が十分には得られない.このため,8本のマイクロフォンを用いたビームフォーミングにより混合音を分離するとともにマルチチャネルポストフィルタから得られるチャネル間干渉情報を基に,missing maskを自動生成した.本手法により分離認識性能は,正解から作成される演繹マスクによる性能に大幅に近づけることが可能となり,本成果は,国際会議論文として採択された. (3)音一般の認識と対話システムへの展開:環境音の擬音語自動認識システムと繰り返し音の自動認識システムを開発し,環境音の音模倣とリズム模倣が可能となった.また,音声認識誤りによる解釈曖昧性を解消するために,柔軟な対話手法を開発し,デモによりその有効性を実証した.
|