2004 Fiscal Year Annual Research Report
ヒューマノイドのためのアクティブ・オーディションを用いた音環境理解の研究
Project/Area Number |
15200015
|
Research Institution | Kyoto University |
Principal Investigator |
奥乃 博 京都大学, 情報学研究科, 教授 (60318201)
|
Co-Investigator(Kenkyū-buntansha) |
駒谷 和範 京都大学, 情報学研究科, 助手 (40362579)
後藤 真孝 独立行政法人 産業技術総合研究所, 情報処理研究部門, 研究員
中臺 一博 (株)ホンダ・リサーチ・インスティチュート・ジャパン, シニア・リサーチャー
和田 俊和 和歌山大学, システム工学部, 教授 (00231035)
宮原 誠 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (00115122)
|
Keywords | ロボット聴覚 / ミッシングフィーチャー理論 / 自動マスク生成 / 黄忠実音再生システム / 対人距離によるインタラクション / 色ターゲット検出 / 環境音の擬音語自動認識 / 楽器音自動認識・歌手認識 |
Research Abstract |
第2年目の主たる成果は以下の通りである。 (1)対人距離に基づくインタラクションモデルの詳細化:昨年度開発したモデルを個別ロボットのセンサ機能や出力装置に合わせて詳細化する手法を開発し、デモで有効性を実証した。また、その成果は国際会議で発表するとともに、ジャーナル論文にも掲載された。 (2)ミッシングフィーチャ理論に基づく分離音声認識システムの汎用性の確認:方向や話者に依存した音響モデルを使用せず、話者独立のクリーンな単一の音響モデルで3話者同時発話認識を行うために、動的に欠落特徴が扱えるミッシングフィーチャ理論に基づいた音声認識システムを開発し、正解から作成する演繹ミッシングマスクにより、分離音の認識精度が大幅に向上することを、異種のヒューマノイドロボットSIG2・Replie・ASIMO上で実証し、本手法の一般性を確認した。その成果はジャーナル論文に採録された。 (3)自動ミッシングフィーチャマスク生成法の開発:(2)の汎用性の確認を受け、2本のマイクロフォンによる音源分離システムADPFで自動マスク生成を試みたが、うまくいかなかった。そのため、8本のマイクロフォンアレイを用いた幾何学的音源分離法とマルチチャネルポストフィルタから得られるチャネル間干渉情報に基づいた自動マスク生成法を開発し、3話者同時発話認識が演繹マスクの性能の80%まで改善した。 (4)音一般の認識と対話システムへの展開:環境音を擬音語でタグ付けをし、環境音を擬音語で検索できるシステムを開発した。音声対話では人が聞き間違える可能性を削減するために付加表現生成法を開発した。また、楽器音認識や歌手認識にも取り組んだ。 (5)顔追跡・識別・視線方向追跡法の開発:インタラクション高度化のために顔追跡と識別を同時処理する手法を開発し、白目と黒目との境界に注目した視線方向追跡法を開発した。 (6)超忠実音再生システムの導入:宮原教授開発システムを導入し、再現性の高い音響実験が可能となった。
|
Research Products
(21 results)