2006 Fiscal Year Annual Research Report
非音声入力音識別に基づく日常型ロボットインタフェースの開発
Project/Area Number |
17700195
|
Research Institution | Wakayama University |
Principal Investigator |
西村 竜一 和歌山大学, システム工学部, 助手 (00379611)
|
Keywords | 雑音認識 / ロボット / 対話インタフェース / 混合ガウス分布モデル / 非言語インタラクション |
Research Abstract |
本研究の目的は、従来の音声対話インタフェース開発では不要なものとして除外されてきた様々な雑音を識別し、対話処理の中で積極的に活用することで、ロボットと人の対話コミュニケーションを円滑にする非音声インタラクション手法を開発することである。平成18年度は、昨年度作成したプラスチック人形によるプロトタイプシステムを実験環境として用いることで、以下の点について調査、検討を進めた。 1)叩かれた箇所の推定手法の検討 対話内容に多様性を持たせるための一つの検討として、叩かれた場所を推定する手法の開発を試みた。これまでのプロトタイプシステムでは一個だった内蔵マイクロホンを二個に増やし、到来信号の差分情報を叩かれた箇所(左右)の識別の入力として用いる。当初考えたのは二信号間の相互相関から算出する時間差情報及び信号のパワーの物理的属性を併用した識別法である。しかし、予備実験の結果、人形内部で発生する音の反射、固体振動の影響が大きく、本研究ではこの手法を適用するのが困難であることがわかった。この考察を省みて、新たに二つの信号の差分波形を統計的に学習し、左右識別を実行する手法を提案した。また、提案手法により、一定の左右識別性能を得ることを確認した。 2)雑音識別に適した音響特徴量の検討 作成したプロトタイプシステムにおいては、音響特徴のモデル化にGMM(混合正規分布モデル)、特徴量にMFCC(メル周波数ケプストラム係数)を用いた雑音識別手法を利用している。これまでの実験では、この構成で一定の識別性能を確認している。しかし、MFCCは、音声認識用の音響特徴量として設計されたものである。そこで、他の音響特徴量を含めることによる識別性能の影響を調査した。その結果、精度向上の傾向は得られたが、従来からの特徴量においても、著しく性能が劣ることはないことを確認した。
|
Research Products
(5 results)