2010 Fiscal Year Annual Research Report
音圧差検出と認識の双方向処理に基づく移動ロボットに適した音環境理解の研究
Project/Area Number |
22700192
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
佐々木 洋子 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (00574013)
|
Keywords | マイクロホンアレイ / 音源定位 / 音源分離 / 環境音識別 |
Research Abstract |
走行中のロボットが「知っている音には気づける」機能を実現するために、マイクロホンアレイによる音圧差の検出をベースとするアプローチに加え、既知の音モデルに基づく認識を取り入れたトップダウンアプローチについて研究を進めている。本年度は、1)方位角・仰角の2次元に高精度音源定位可能なマイクロホンアレイの開発、および、2)一連の音響信号から「どの部分が何の音か」を理解する機能、の2テーマに取り組んだ。 まず車輪型ロボットに搭載可能な直径350mm、64チャンネルの球形マイクロホンアレイを開発では、ビームフォーミング時の指向特性を定量評価することで最適なマイクロホン配置を設計した。方位角・仰角の2次元方向に対し全方位に高感度な指向特性を持ち、走行中のロボットから複数の音源を高精度に定位・分離可能である。開発したアレイを屋外自律走行ロボットSegway RMT200に搭載し、移動しながら同時に2音源を誤差6deg以下で定位可能であることを確認した。 次に日常環境中の音をモデル化するひとつのアプローチとして、Web上で日々更新される大規模な音データであるポッドキャストを対象とし、継続的に更新可能な音識別モデル構築の枠組みを提案した。提案法はコンピュータによる認識誤りを、ポッドキャストを視聴するユーザに訂正してもらうことでデータを蓄積し、未知の条件が多い実環境の音へ対応できる柔軟なモデルを構築可能であることが特徴である。一連の音響信号から、音楽・人の声・その他の音、といった音の種類を識別する手法と、ユーザが視聴しながら訂正可能なインタフェースを開発し、実際にWeb上で配信されているポッドキャストを対象とした評価実験を行った。視聴しながら停止操作なしで89%を訂正可能で、蓄積したデータを用いた追加学習により音識別性能が向上することを確認した。
|