2013 Fiscal Year Annual Research Report

共演者音楽ロボット実現のための音響信号に基づく音楽インタラクション手法の開発

Research Project

Project/Area Number	11J06577
Research Institution	Kyoto University
Principal Investigator	大塚琢馬京都大学, 情報学研究科, 特別研究員(DC1)
Project Period (FY)	2011 – 2014-03-31
Keywords	マクロホンアレイ / ノンパラメトリックベイズ / ロボット聴覚 / 音環境理解
Research Abstract	本研究では, 共演者音楽ロボットをはじめ, 音を聴くロボットに対して必須の技術である, 様々な音の聴き分け技術を, マイクロフォンアレイを通じて実現する. 従来のマイクロフォンアレイ処理は, 入力混合音や音源が存在する環境に対して様々な仮定や制約を設ける手法が多かった. 例えば, 入力混合音に含まれる音源の数を既知とすることや, 環境中の壁や床での音の反射に由来する残響に関するパラメータを既知とする場合があった. 本研究では, ロボットが音を聴く環境に関する未知要因を柔軟に扱うため, ベイズ統計モデルに基づく確率的なマイクロフォンアレイ処理の定式化を行い, 音源数や残響の量が未知である場合でも, 状況に応じたパラメータチューニングなどが不要な手法を開発した. 具体的には, ノンパラメトリックベイズモデルを適用することで, (1)音源数が未知という課題に対しては, 音源数に応じたモデルの複雑さの選択を回避し, (2)残響の量に応じて自己回帰モデルの次数を手動でチューニングする必要を除いた. 本研究の貢献は, マイクロフォンアレイ処理でよく実現される3つの機能(a)音源分離, (b)音源定位, (c)残響除去をノンパラメトリックベイズに基づく統一モデルとして定式化し, その有効性を示した点である. これらの成果のうち, 混合音の分離処理に関する手法は査読付き英文論文誌に発表された. さらに, 本手法を残響除去が可能なモデルへと拡張した成果も英文論文誌に投稿, 現在査読中である. また, これら一連の成果は博士論文にまとめた.
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason ロボットは多様な音環境においても頑健に音を聴き分け, 理解するという目的に対し, 頑健な音の聴き分け手法の開発を行うことができた.
Strategy for Future Research Activity	混合音から分離抽出(聴き分け)した音に対し, 音高抽出や音声認識, 音源同定などの音環境理解へと発展させることが重要である. 従来の音に関するパターン認識問題では, 音響特徴量は音源分離などの歪みを伴う処理に対して脆弱であった, その点への対処が今後の大きな課題である.

Research Products
(4 results)

All 2014 2013 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (1 results) Remarks (1 results)

[Journal Article] Bayesian Nonparametries for Microphone Array Processing2014
- Author(s)
  T. Otsuka, et al.
- Journal Title
  
  IEEE/ACM Transactions on Audio, Speech and Language Processing
  
  Volume: 22 : 2 Pages: 493-504
- DOI
  10.1109/TASLP.2013,2294582
- Peer Reviewed
[Journal Article] Spatio-Temporal Dynamics in Collective Frog Choruses Examined by Mathematical Modeling and Field Observation2014
- Author(s)
  I. Aihara, et al.
- Journal Title
  
  Scientific Reports
  
  Volume: 4 : 3891
- DOI
  10.1038/srep03891
- Peer Reviewed
[Presentation] Solving Google's Continuous Audio CAPTCHA with HMM-based Automa tic Speech Recognition2013
- Author(s)
  S. Sano, T. Otsuka, et al.
- Organizer
  the 8th International Workshop on Security (IWSEC 2013)
- Place of Presentation
  Okinawa
- Year and Date
  2013-11-18
[Remarks]
- URL
  http://winnie.kuis.kyoto-u.ac.jp/members/ohtsuka/research_demo_jp.html

2013 Fiscal Year Annual Research Report

共演者音楽ロボット実現のための音響信号に基づく音楽インタラクション手法の開発

Principal Investigator

大塚 琢馬 京都大学, 情報学研究科, 特別研究員(DC1)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Bayesian Nonparametries for Microphone Array Processing2014

Author(s)

Journal Title

DOI

[Journal Article] Spatio-Temporal Dynamics in Collective Frog Choruses Examined by Mathematical Modeling and Field Observation2014

Author(s)

Journal Title

DOI

[Presentation] Solving Google's Continuous Audio CAPTCHA with HMM-based Automa tic Speech Recognition2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

大塚琢馬京都大学, 情報学研究科, 特別研究員(DC1)