2008 Fiscal Year Annual Research Report

音源方向推定および音源分離機能を有するロボットの擬似聴覚機能に関する研究

Research Project

Project/Area Number	19700186
Research Institution	Kumamoto National College of Technology
Principal Investigator	中島栄俊 Kumamoto National College of Technology, 電子制御工学科, 准教授 (00353350)
Keywords	両耳聴モデル / HRTF / 音源分離 / DOA / IPD / ILD / 擬似聴覚機能 / ヒューマノイドロボット
Research Abstract	本研究では、人間聴覚の両耳聴モデル(FDBM)をロボット聴覚機能の一部として用い, 観測信号から特定音声信号のみを分離し, 人間とのコミュニケーションで非常に重要となる音声認識精度を向上させるロボット聴覚システムを構築することである。このシステムを構築するにあたって、(1)実時間音源分離・音声認識システムの構築(2)実環境下における音源方向推定性能の改善(3)実環境下における音源分離性能の改善、に関する研究を行ってきた。 (1)においては音源分離アルゴリズムであるFDBMをリアルタイム処理させ目的音声を分離抽出した後、音源信号を音声認識システムJuliusに受け渡し、特定単語を認識させるシステムを構築した。一方、(2)および(3)の研究においては、同システムを実環境下で動作させるべくシステムの大幅な改良を行った。特に、FDBMは音源方向推定および分離を行うにあたり、データベースとして頭部伝達関数から算出されるIPD、ILDを利用しているが、環境の変化によりこのIPD、ILDが変動するため、環境に応じてこれらの値を更新することを試みた。この更新にあたっては、i)ロボットの頭部回転による更新、ii)ロボットに搭載したステレオカメラを用いた更新、の手法について検討した。この結果、両者ともにデータベースの更新に利用できることが確認され、音源方向推定性能および分離性能の改善が見られた。しかし一方で残響時間や背景雑音の影響によりデータベースの更新が難しい場合もあり、結果として性能改善が低くなるケースも見られる。今後はより多くの状況下で精度よく動作するデータベース更新アルゴリズムの開発を行う。

Research Products

(2 results)

All Journal Article (1 results) Presentation (1 results)

[Journal Article] 周波数領域両耳聴モデルを用いたロボット聴覚実現の試み2008
- Author(s)
  中島栄俊
- Journal Title
  
  日本高専学会誌 Vol.13, No.4
  
  Pages: 32-35
[Presentation] 画像情報を利用したFDBMのデータベース更新による音源分離性能改善の試み2008
- Author(s)
  中島栄俊
- Organizer
  日本音響学会
- Place of Presentation
  東京工業大学
- Year and Date
  2008-03-19