研究課題
本研究は、従来の音声対話インタフェース開発では不要なものとして除外されてきた様々な雑音を識別し、対話処理の中で積極的に活用することで、ロボットと人の対話コミユニケーションを円滑にする非音声インタラクション手法を開発することを目的とする。最終年度では以下の項目について研究を実施した。1)非音声入力音識別のための音響特徴量の検討開発したプロトタイプシステムでは、音響分析特徴量に音声認識で利用されるものと同一の物理属性を用いていた。また、昨年度の実験により、このパラメタが雑音の識別においても一定の識別性能を示すことは確認された。将来の音声認識とのシステム統合を考えると同じ特徴量を用いるメリットは存在する。しかし、ロボット本体の形、材質が同じであっても、プラスチック成型の微妙な違いにより、ロボットを叩いたときの音が若干だが異なるのが一般である。このため、ある固体で作成した統計モデルが、別の固体では正しく動作しないことが予想される。また、これまでのパラメタを構成する特徴量を削減することで計算付加を低減することができる。これらの検証を行うため、非音声入力音識別に有効な音響特徴量の構成を検討した。実験の結果、特徴量の複雑さと識別精度はほぼ正の相関を持つが、識別率での最大の差は0.2%程度に収まることを確認した。また、特徴量の次元数を低く設定することで応答速度の向上を得ることができた。以上の知見からインタラクションシステムとしての設計を見直し、提案手法の完成度を上げることができた。2)デモビデオの公開研究成果公開の一環として、プロトタイプシステムのデモンストレーションビデオを作成した。また、Webぺージ上で公開し、インターネットを介しての閲覧を可能とした。
すべて 2007 その他
すべて 雑誌論文 (2件) (うち査読あり 2件) 備考 (1件)
計測と制御 Vol.46,No.6
ページ: 441-446
IEICE TRANSACTIONS on Information and Systems Vol.E91-D,No.3
ページ: 576-587
http://www.wakayama-u.ac.jp/~nisimura/