2013 Fiscal Year Annual Research Report
共演者音楽ロボット実現のための音響信号に基づく音楽インタラクション手法の開発
Project/Area Number |
11J06577
|
Research Institution | Kyoto University |
Principal Investigator |
大塚 琢馬 京都大学, 情報学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2011 – 2014-03-31
|
Keywords | マクロホンアレイ / ノンパラメトリックベイズ / ロボット聴覚 / 音環境理解 |
Research Abstract |
本研究では, 共演者音楽ロボットをはじめ, 音を聴くロボットに対して必須の技術である, 様々な音の聴き分け技術を, マイクロフォンアレイを通じて実現する. 従来のマイクロフォンアレイ処理は, 入力混合音や音源が存在する環境に対して様々な仮定や制約を設ける手法が多かった. 例えば, 入力混合音に含まれる音源の数を既知とすることや, 環境中の壁や床での音の反射に由来する残響に関するパラメータを既知とする場合があった. 本研究では, ロボットが音を聴く環境に関する未知要因を柔軟に扱うため, ベイズ統計モデルに基づく確率的なマイクロフォンアレイ処理の定式化を行い, 音源数や残響の量が未知である場合でも, 状況に応じたパラメータチューニングなどが不要な手法を開発した. 具体的には, ノンパラメトリックベイズモデルを適用することで, (1)音源数が未知という課題に対しては, 音源数に応じたモデルの複雑さの選択を回避し, (2)残響の量に応じて自己回帰モデルの次数を手動でチューニングする必要を除いた. 本研究の貢献は, マイクロフォンアレイ処理でよく実現される3つの機能(a)音源分離, (b)音源定位, (c)残響除去をノンパラメトリックベイズに基づく統一モデルとして定式化し, その有効性を示した点である. これらの成果のうち, 混合音の分離処理に関する手法は査読付き英文論文誌に発表された. さらに, 本手法を残響除去が可能なモデルへと拡張した成果も英文論文誌に投稿, 現在査読中である. また, これら一連の成果は博士論文にまとめた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ロボットは多様な音環境においても頑健に音を聴き分け, 理解するという目的に対し, 頑健な音の聴き分け手法の開発を行うことができた.
|
Strategy for Future Research Activity |
混合音から分離抽出(聴き分け)した音に対し, 音高抽出や音声認識, 音源同定などの音環境理解へと発展させることが重要である. 従来の音に関するパターン認識問題では, 音響特徴量は音源分離などの歪みを伴う処理に対して脆弱であった, その点への対処が今後の大きな課題である.
|
Research Products
(4 results)