2008 Fiscal Year Annual Research Report
音源方向推定および音源分離機能を有するロボットの擬似聴覚機能に関する研究
Project/Area Number |
19700186
|
Research Institution | Kumamoto National College of Technology |
Principal Investigator |
中島 栄俊 Kumamoto National College of Technology, 電子制御工学科, 准教授 (00353350)
|
Keywords | 両耳聴モデル / HRTF / 音源分離 / DOA / IPD / ILD / 擬似聴覚機能 / ヒューマノイドロボット |
Research Abstract |
本研究では、人間聴覚の両耳聴モデル(FDBM)をロボット聴覚機能の一部として用い, 観測信号から特定音声信号のみを分離し, 人間とのコミュニケーションで非常に重要となる音声認識精度を向上させるロボット聴覚システムを構築することである。このシステムを構築するにあたって、(1)実時間音源分離・音声認識システムの構築(2)実環境下における音源方向推定性能の改善(3)実環境下における音源分離性能の改善、に関する研究を行ってきた。 (1)においては音源分離アルゴリズムであるFDBMをリアルタイム処理させ目的音声を分離抽出した後、音源信号を音声認識システムJuliusに受け渡し、特定単語を認識させるシステムを構築した。一方、(2)および(3)の研究においては、同システムを実環境下で動作させるべくシステムの大幅な改良を行った。特に、FDBMは音源方向推定および分離を行うにあたり、データベースとして頭部伝達関数から算出されるIPD、ILDを利用しているが、環境の変化によりこのIPD、ILDが変動するため、環境に応じてこれらの値を更新することを試みた。この更新にあたっては、i)ロボットの頭部回転による更新、ii)ロボットに搭載したステレオカメラを用いた更新、の手法について検討した。この結果、両者ともにデータベースの更新に利用できることが確認され、音源方向推定性能および分離性能の改善が見られた。しかし一方で残響時間や背景雑音の影響によりデータベースの更新が難しい場合もあり、結果として性能改善が低くなるケースも見られる。今後はより多くの状況下で精度よく動作するデータベース更新アルゴリズムの開発を行う。
|
Research Products
(2 results)