Research Abstract |
(1)「音を聞き分ける」音の量的爆発促進技術: 使用環境,設置条件に制約がなく使えるように,環境に関する事前知識量を極力減らした実時間ロボット聴覚ソフトウエア「HARK」を開発した.HARKは,FlowDesignerというミドルウエアの上に,音源定位,音源分離,ミッシングフィーチャマスク自動生成,ミッシングフィーチヤ理論に基づく音声認識を組み込んだシステムである.体型が全く異なる3体のロボットで異なる配置のマイクロフォンアレイやサラウンドマイクロフォンを入力機器とし,ノートPC上で稼動する.3人同時の料理注文を受けるロボット,口によるジャンケンの審判をするロボットのデモを開発し,HARKの移植性の高さを実証した.IEEE/RSJ IROS-2006 Best Paper Finalistを受賞した. (2)「音を見せる」音の質的複雑さ軽減技術: HARKとJava3Dによるviewerとをネットワークで接続して音を音環境可視化システムを開発した.GUIは,"Overview first, zoom and filter, then details on demand"という方針で設計した.Overview firstでは音の到来方向を実時間で表示し,Zoom and filterでは指定された範囲にある方向の音だけを提示し,Details on demandでは特定の音だけを分離し提示,あるいは音声認識結果を提示することができる.さらに,聴覚障害者の情報保障のために,HMDに音源到来方向と音声認識結果を表示するシステムに応用した. (3)音楽を聞き分ける技術として,市販CD音楽を聞き分け,ビートを認識し,次のビートを予想してステップを踏むロボットの開発も行い,実時間で動くことが確認できた.自分の耳で音楽を聞き分けるロボットは世界初である.
|