研究概要 |
(1) 音情報の量的爆発を促進するために【音を聞き分ける技術】に,(2) 音情報提示での複雑化を軽減するために【音を見せる技術】に,取り組んだ.具体的な項目は以下の通りである: (1) (1)「音を聞き分ける」:分離音認識・白己生成音抑制・移動話者対応 ・特徴量信頼度としてソフトマスク自動生成開発.音声認識性能が10ポイント向上. ・自己発話音抑制機能をセミブラインドICAで実現.同時に,反射・残響抑制も. (2)「音源方向を見せる」:ヒューマンコミュニケーション特性の測定 ・無響室で,多様な姿勢からの発声を測定し,姿勢による発声音の特徴変化を解析. ・解析データを基に,発声音の声質を発声者の姿勢(首の左右,上下)に応じて変更. (2) (3)「音を記号表現として見せる」:音情報可視化・テキストとの連携・音源同定 ・音環境用AuditoryScene XMLを設計.文書の談話展開と統合し,GUIを設計. ・突発性の異常音を同定する機能をMP(Matching Pursuit)とHMMで開発. (4)「音の記号表現に意味を与える」:高度インタラクションへの展開 ・音楽による協調のために,音楽ロボット用アンサンブル演奏法を設計. ・自己歌声や生成音を上記手法で抑制し,相手演奏に対する実時間楽譜追跡を開発. ・割込み発話であるバージイン発話での発話者意図推定のための特徴量抽出法を開発. 特記事項:米国Willow Garage社のロボットにロボット聴覚システムHARKを搭載. 音情報可視化システムをベースにGUIを開発.
|