研究概要 |
本研究では,ロボットが実環境中に存在する音を自身の身体に備え付けられたマイクロホンを通じて聞き取る技術を扱う.これは,音楽ロボットが共演している人間の演奏を聞き取るなどの場面で必須の技術となる.平成24年度は,様々な音源が複数存在しうる環境での聞き分け技術を複数のマイクロホンを用いたマイクロホンアレイ技術の発展に注力した.特に,マイクロホンアレイを用いて実現される3つの主要機能(a)音源定位,(b)音源分離,(c)残響除去について,ノンパラメトリックベイズ理論に基づく統一的なモデル化を行った.このモデル化により,従来は環境に存在する音源の数は既知であるとされたアルゴリズムに対する制約を,環境に対する音源数などの事前知識が限られる場面でも適用可能な手法へ発展させることを狙う.以下では,これらの中から2つの成果について報告する. (1)ノンパラメトリックベイズによる音源定位・分離の統一モデル 本項目では,ロボットが環境中に複数存在する音の混合音を観測した際,どこでどんな音がしたかを知る機能である,各音源の到来方向の推定(音源定位)および,元の音響信号の復元倍源分離)を扱う.従来のアルゴリズムでは,環境中に存在する音源数が既知とするなどの制約があったため,ロボットが一般の環境を行き来する場合や,様々な音が入り乱れる環境などでの適用が困難であった.本手法は,音源定位・分離問題を統計的クラスタリング問題として定式化し,ノンパラメトリックベイズ理論を応用することで,未知の音源数に対する音源定位・分離問題を統一的に扱うことを可能にする.この研究成果は英文論文誌に投稿中である. (2)音源定位・分離・残響除去の統一モデル 本項目では,上記の機能に加え,屋内環境で音を観測した際に混入する残響の除去をマイクロホンアレイ処理に組み込む.残響は,音源定位や分離の性能に悪影響を与えるだけではなく,分離音に対する音声認識処理等の情報処理にも影響を与える要因になる.マイクロホンアレイによる残響除去技術の従来手法も,音源数はマイクロホンの数より小さいなどの制約が存在するため,これらの制約を緩和し,一般の未知環境で適用可能な手法の開発を目指す.
|