• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

共演者音楽ロボット実現のための音響信号に基づく音楽インタラクション手法の開発

研究課題

研究課題/領域番号 11J06577
研究機関京都大学

研究代表者

大塚 琢馬  京都大学, 情報学研究科, 特別研究員(DC1)

キーワード音環境理解 / ロボット聴覚 / マイクロホンアレイ / ベイズモデル / 音源定位・分離 / 残響除去
研究概要

本研究では,ロボットが実環境中に存在する音を自身の身体に備え付けられたマイクロホンを通じて聞き取る技術を扱う.これは,音楽ロボットが共演している人間の演奏を聞き取るなどの場面で必須の技術となる.平成24年度は,様々な音源が複数存在しうる環境での聞き分け技術を複数のマイクロホンを用いたマイクロホンアレイ技術の発展に注力した.特に,マイクロホンアレイを用いて実現される3つの主要機能(a)音源定位,(b)音源分離,(c)残響除去について,ノンパラメトリックベイズ理論に基づく統一的なモデル化を行った.このモデル化により,従来は環境に存在する音源の数は既知であるとされたアルゴリズムに対する制約を,環境に対する音源数などの事前知識が限られる場面でも適用可能な手法へ発展させることを狙う.以下では,これらの中から2つの成果について報告する.
(1)ノンパラメトリックベイズによる音源定位・分離の統一モデル
本項目では,ロボットが環境中に複数存在する音の混合音を観測した際,どこでどんな音がしたかを知る機能である,各音源の到来方向の推定(音源定位)および,元の音響信号の復元倍源分離)を扱う.従来のアルゴリズムでは,環境中に存在する音源数が既知とするなどの制約があったため,ロボットが一般の環境を行き来する場合や,様々な音が入り乱れる環境などでの適用が困難であった.本手法は,音源定位・分離問題を統計的クラスタリング問題として定式化し,ノンパラメトリックベイズ理論を応用することで,未知の音源数に対する音源定位・分離問題を統一的に扱うことを可能にする.この研究成果は英文論文誌に投稿中である.
(2)音源定位・分離・残響除去の統一モデル
本項目では,上記の機能に加え,屋内環境で音を観測した際に混入する残響の除去をマイクロホンアレイ処理に組み込む.残響は,音源定位や分離の性能に悪影響を与えるだけではなく,分離音に対する音声認識処理等の情報処理にも影響を与える要因になる.マイクロホンアレイによる残響除去技術の従来手法も,音源数はマイクロホンの数より小さいなどの制約が存在するため,これらの制約を緩和し,一般の未知環境で適用可能な手法の開発を目指す.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

音を聴くロボットを実環境中に展開するために重要な要素技術(音源定位・分離・残響除去)を実現するマイクロホンアレイ処理の開発が順調に進捗しているため.

今後の研究の推進方策

今後は,開発したマイクロホンアレイ処理を実環境中で動くロボットに搭載しての動作実験や,音楽ロボットでのインタラクションに対する有効性の確認などを予定している.

  • 研究成果

    (5件)

すべて 2013 2012

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件)

  • [雑誌論文] Nonparametrie Bayesina Sparse Factor Analysis for Frequency Doain Blind Source Separation without Pearmuat ion Ambisuity2013

    • 著者名/発表者名
      Kohei Nagira, Takuma Otsuka, Hiroshi G. Okuno
    • 雑誌名

      EURASIP Journal on Audio, Speech, and Music Processing

      巻: 2013(4) ページ: 14

    • DOI

      doi:10.1186/1687-4722-2013-4

    • 査読あり
  • [雑誌論文] Infinite Sparse Factor Analys for Blind Source Separation in Reverberant Environments2012

    • 著者名/発表者名
      Kohei Nagira, Takuma Otsuka, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 7,626 ページ: 638-647

    • DOI

      doi:10.1007/978-3-642-34166-3_70

    • 査読あり
  • [学会発表] マイクロホンアレイを用いた音源定位・分離の統一的ノンパラメトリックベイズモデル2012

    • 著者名/発表者名
      大塚琢馬, ら
    • 学会等名
      第27回 信号処理シンポジウム
    • 発表場所
      ANAインターコンチネンタル石垣リゾート(沖縄県)
    • 年月日
      2012-11-29
  • [学会発表] Unified Auditory Functions based on Bayesian Topic Model2012

    • 著者名/発表者名
      Takuma Otsuka, et al.
    • 学会等名
      Proc. of International Conference on Intelligent Robots and Systems (IROS-2012)
    • 発表場所
      Vilamoura (ポルトガル)
    • 年月日
      2012-10-09
  • [学会発表] Bayesian Unification of Sound Source Localization and Separation with Permutation Resolution2012

    • 著者名/発表者名
      Takuma Otsuka, et al.
    • 学会等名
      Proc. of the Twenty-Sixth AMI Conference on Artificial Intelligence (AAAI-12)
    • 発表場所
      Toronto (カナダ)
    • 年月日
      2012-07-26

URL: 

公開日: 2014-07-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi