2009 Fiscal Year Annual Research Report
音響信号記号変換に基づいたセマンティックインタラクション
Publicly Offered Research
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
21013030
|
Research Institution | Kyoto University |
Principal Investigator |
奥乃 博 Kyoto University, 情報学研究科, 教授 (60318201)
|
Co-Investigator(Kenkyū-buntansha) |
高橋 徹 京都大学, 情報学研究科, 助教 (30419494)
|
Keywords | ロボット聴覚 / 音響信号記号変換 / セミブラインド音源分離 / 発達論的コミュニケーション / ミッシングフィーチャ理論 / 自己生成音抑制 / 音楽ロボット / HARK |
Research Abstract |
(1) 音情報の量的爆発を促進するために【音を聞き分ける技術】に,(2) 音情報提示での複雑化を軽減するために【音を見せる技術】に,取り組んだ.具体的な項目は以下の通りである: (1) (1)「音を聞き分ける」:分離音認識・白己生成音抑制・移動話者対応 ・特徴量信頼度としてソフトマスク自動生成開発.音声認識性能が10ポイント向上. ・自己発話音抑制機能をセミブラインドICAで実現.同時に,反射・残響抑制も. (2)「音源方向を見せる」:ヒューマンコミュニケーション特性の測定 ・無響室で,多様な姿勢からの発声を測定し,姿勢による発声音の特徴変化を解析. ・解析データを基に,発声音の声質を発声者の姿勢(首の左右,上下)に応じて変更. (2) (3)「音を記号表現として見せる」:音情報可視化・テキストとの連携・音源同定 ・音環境用AuditoryScene XMLを設計.文書の談話展開と統合し,GUIを設計. ・突発性の異常音を同定する機能をMP(Matching Pursuit)とHMMで開発. (4)「音の記号表現に意味を与える」:高度インタラクションへの展開 ・音楽による協調のために,音楽ロボット用アンサンブル演奏法を設計. ・自己歌声や生成音を上記手法で抑制し,相手演奏に対する実時間楽譜追跡を開発. ・割込み発話であるバージイン発話での発話者意図推定のための特徴量抽出法を開発. 特記事項:米国Willow Garage社のロボットにロボット聴覚システムHARKを搭載. 音情報可視化システムをベースにGUIを開発.
|
Research Products
(44 results)