2005 Fiscal Year Annual Research Report
非音声入力音識別に基づく日常型ロボットインタフェースの開発
Project/Area Number |
17700195
|
Research Institution | Wakayama University |
Principal Investigator |
西村 竜一 和歌山大学, システム工学部, 助手 (00379611)
|
Keywords | 雑音認識 / ロボット / 対話インタフェース / 混合ガウス分布モデル / 非言語インタラクション |
Research Abstract |
本研究の目的は、従来の音声対話インタフェース開発では不要なものとして除外されてきた様々な雑音を識別し、対話処理の中で積極的に活用することで、ロボットと人の対話コミュニケーションを円滑にする非音声インタラクション手法を開発することである。平成17年度は、予備評価用のプロトタイプシステムとして、非音声インタラクションが実際に動作するシステムをプラスチックの人形を用いて試作した。ロボットに見立てた非稼動の人形を用意し、内部に無指向性の小型マイクを一個取り付け、USBオーディオインタフェースを経由して計算機に音を入力できるようにした。入力音をもとにユーザ動作の認識を行う識別アルゴリズムには、音響特徴のモデル化にGMM(混合正規分布モデル)、特徴量にMFCC(メル周波数ケプストラム係数)を用いた雑音識別手法を応用した。この際、プロトタイプシステムを叩いた音、撫でた音を6名の被験者から収集し、モデルの学習用データとした。試作したプロトタイプシステムは、叩かれた時は「やめて」、撫でられた時は「ありがとう」と反応を返すことができる。そして、雑音と人間の声を識別することで、声による呼びかけにも応答することができる。評価実験の結果、叩かれた音、撫でられた音、音声の識別で90.3%の識別正解率を得ることができ、提案手法を人間の動作認識に利用することが可能であることを確認した。対話内容に多様性を持たせるための一つの検討として、叩かれた(撫でられた)場所の推定も試みたが、本手法では十分な精度を得ることができなかった。そこで、マイクを複数に増やし、到来信号の時間差情報を併用することで、場所推定も可能にする手法の検討を開始した。また、現状では、叩く、撫でる、音声の3つである識別クラスをさらに増やすことも検討している。
|
Research Products
(5 results)