• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

アクティブオーディションによるロボット聴覚機能の向上

研究課題

研究課題/領域番号 21700195
研究機関京都大学

研究代表者

高橋 徹  京都大学, 大学院・情報学研究科, GCOE助教 (30419494)

キーワードロボット聴覚 / 音源定位 / 音源分離 / 分離音声認識 / 音源追跡
研究概要

本年度の目的は,移動中の音源定位手法を開発することであった.ロボット静止時に移動音源を定位する手法(MUSIC手法)をベース手法にして解決した.当初の課題は,ロボット移動中にも移動音源を定位する方法を開発することであり,ロボットから音源を見たときに,音源が交差する場合は想定していなかった.現実には,ロボットの移動により,音源の交差が頻繁に起こる、交差に対応可能な手法を開発し,シミュレーション混合した複数移動音の交差音源を,音源を区別しながら追跡できることを確認できた.音源定位手法と音源追跡手法を統合し,音色情報を手掛かりに加えたことにより,交差移動音源に対応可能になった.これにより,ロボットの動きに対する制約が緩和され,アクティブオーディションのためのより自由なロボット動作が可能になった.
ロボットの移動中の実移動音源の定位・追跡については,新たな課題が,明らかになった.ロボット移動中に移動音が発生することは,当初から想定されていたため,22年度までに開発した手法を用いて対応した.しかし,評価用移動音源を準備することが困難であった.再現性のある評価用移動音源を構成するためには,移動音源の移動機構自体が静粛性をもたなければならい,今回は,静粛性をもつ移動音源を用いた評価を優先し,予め複数人が,歩行しながら,発声している音声を収録し,評価用移動音源とした.人の移動は十分静粛であり,移動音は出ないが,厳密な音源位置や,移動速度,移動方向が未知であるという課題が残った.つまり再現性のある実験が困難であった.また,複数移動音源の音源方向推定精度や音源追跡精度を議論できなかった.これらの課題については,評価システムそのものを開発する必要があるため,別途研究課題を設定し,解決していきたい.

  • 研究成果

    (31件)

すべて 2012 2011 その他

すべて 雑誌論文 (12件) (うち査読あり 12件) 学会発表 (15件) 図書 (3件) 備考 (1件)

  • [雑誌論文] Efficient Blind Dereverberation and Echo Cancellation based on Independent Component Analysis for Actual Acoustic Signals2012

    • 著者名/発表者名
      Ryu Takeda
    • 雑誌名

      Neural Computation

      巻: 24 ページ: 234-272

    • DOI

      10.1162/NECO_a_00219

    • 査読あり
  • [雑誌論文] Complex Extension of Infinite Sparse Factor Analysis for Blind Speech Separation2012

    • 著者名/発表者名
      Kohei Nagira
    • 雑誌名

      Proceedings of 10th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA-2012)

    • 査読あり
  • [雑誌論文] A GMM Sound Source Model for Blind Speech Separation in Under-determined Condisions2012

    • 著者名/発表者名
      Yasuharu Hirasawa
    • 雑誌名

      Proceedings of 10th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA-2012)

    • 査読あり
  • [雑誌論文] Tool-Body Assimilation of Humanoid Robt using Neuro-Dynamical System2011

    • 著者名/発表者名
      Shun Nishide
    • 雑誌名

      IEEE Transactions on Autonomous Mental Development

      巻: 99 ページ: 1-11

    • DOI

      10.1109/TAMD.2011.2177660

    • 査読あり
  • [雑誌論文] 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム2011

    • 著者名/発表者名
      駒谷和範
    • 雑誌名

      情報処理学会論文誌

      巻: 52 ページ: 3374-3385

    • 査読あり
  • [雑誌論文] フレーズ置換のための調波非調波GMM・NMF・残響推定に基づく音源分離・演奏合成2011

    • 著者名/発表者名
      安良岡直希
    • 雑誌名

      情報処理学会論文誌

      巻: 52 ページ: 3839-3852

    • 査読あり
  • [雑誌論文] Complex and Transitive Synchronization in a Frustrated System of Calling Frogs2011

    • 著者名/発表者名
      Ikkyu Aihara
    • 雑誌名

      Journal of American Physical Society, Physical Review E

      巻: 83 ページ: 1-5

    • DOI

      10.1103/PhysRevE.83.031913

    • 査読あり
  • [雑誌論文] Classification of Known and Unknown Environmental Sounds based on Self-organized Space using Recurrent Neural Network2011

    • 著者名/発表者名
      Zhang Yang
    • 雑誌名

      Advanced Robotics

      巻: 25 ページ: 2127-2141

    • DOI

      10.1163/016918611X595017

    • 査読あり
  • [雑誌論文] Use of a Sparse Structure to Improve Learning Performance of Recurrent Neural Networks2011

    • 著者名/発表者名
      Hiromitsu Awano
    • 雑誌名

      Proceedings of 18th International Conference on Neural Information Processing (ICONIP 2011)

    • 査読あり
  • [雑誌論文] Fast and simple iterative algorithm of Lp-norm minimization for under-determined speech separation2011

    • 著者名/発表者名
      Yasuharu Hirasawa
    • 雑誌名

      Proceedings of International Conference on Spoken Language Processing (Interspeech 2011)

    • 査読あり
  • [雑誌論文] Environmental Sound Recognition for Robot Audition using Matching-pursuit2011

    • 著者名/発表者名
      Nobuhide Yamakawa
    • 雑誌名

      Proceedings of International Conference on Spoken Language Processing (Interspeech 2011)

    • 査読あり
  • [雑誌論文] Robot with Two Ears Listens to More Than Two Simultaneous Utterances by Exploiting Harmonic Structures2011

    • 著者名/発表者名
      Yasuharu Hirasawa
    • 雑誌名

      Proceeding of the 24th International Conference on Industrial, Engineering and Other Applications of Applied Intelligence Systems (IEA/AIE-2011)

    • 査読あり
  • [学会発表] Complex Infinite Sparse Factor Analysisによる周波数領域での音声信号のブラインド音源分離2012

    • 著者名/発表者名
      柳楽浩平
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2012-03-07
  • [学会発表] パーティクルフィルタを用いた動的環境下の複数音源追跡2012

    • 著者名/発表者名
      黄楊暘
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2012-03-07
  • [学会発表] 複数音源下での擬音語による音源選択システム2012

    • 著者名/発表者名
      山村祐介
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2012-03-07
  • [学会発表] 発話中の方言変化に頑健な方言変換システム2012

    • 著者名/発表者名
      平山直樹
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2012-03-07
  • [学会発表] アクセント特徴量を用いた歌声と朗読音声の識別システム2012

    • 著者名/発表者名
      阿曽慎平
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2012-03-07
  • [学会発表] ロボットのためのアイクアレイによる複数話者追跡2012

    • 著者名/発表者名
      高橋徹
    • 学会等名
      京都大学ICTイノベーション2012
    • 発表場所
      京都大学(京都府)
    • 年月日
      2012-02-17
  • [学会発表] スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム2012

    • 著者名/発表者名
      阿曽慎平
    • 学会等名
      情報処理学会第94回音楽情報科学研究会
    • 発表場所
      舘山寺温泉(静岡県)
    • 年月日
      2012-02-04
  • [学会発表] Infinite Sparse Factor Analysisの複素拡張による音声信号のブラインド音源分離2011

    • 著者名/発表者名
      柳楽浩平
    • 学会等名
      日本音響学会関西支部第14回若手研究者交流研究発表会
    • 発表場所
      産業技術総合研究所(大阪府)
    • 年月日
      2011-12-18
  • [学会発表] ブラインド音源分離のためのInfinite Sparse Factor Analysisの複素拡張2011

    • 著者名/発表者名
      柳楽浩平
    • 学会等名
      人工知能学会第34回AIチャレンジ研究会
    • 発表場所
      慶応義塾大学(神奈川県)
    • 年月日
      2011-12-15
  • [学会発表] ノンパラメトリックベイズによる時間周波数領域における音声信号のブラインド音源分離2011

    • 著者名/発表者名
      柳楽浩平
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学(東京都)
    • 年月日
      2011-09-09
  • [学会発表] 調波・非調波音源モデルを用いたマイク数以上の音源分離2011

    • 著者名/発表者名
      平澤恭治
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学(東京都)
    • 年月日
      2011-09-09
  • [学会発表] Introduction to Open Source Robot Audition Software HARK2011

    • 著者名/発表者名
      Kazuhiro Nakadai
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学(東京都)
    • 年月日
      2011-09-08
  • [学会発表] 実環境下での音源定位・音源検出の検討2011

    • 著者名/発表者名
      高橋徹
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学(東京都)
    • 年月日
      2011-09-07
  • [学会発表] 同時発話認識ロボットの共通開発プラットフォーム2011

    • 著者名/発表者名
      高橋徹
    • 学会等名
      第13回日本感性工学会大会
    • 発表場所
      工学院大学(東京都)(招待講演)
    • 年月日
      2011-09-04
  • [学会発表] 擬音語と環境音の音響的関係性を考慮した環境音to擬音語変換システム2011

    • 著者名/発表者名
      山川暢英
    • 学会等名
      2011年度人工知能学会全国大会
    • 発表場所
      岩手県立大学(岩手県)
    • 年月日
      2011-06-01
  • [図書] Lecture Notes in Computer Science, 2011, Volume 7064/20112012

    • 著者名/発表者名
      Lieven De Lathauwer
    • 総ページ数
      388-396
    • 出版者
      Springer
  • [図書] Lecture Notes in Computer Science, 2011, Volume 7064/20112011

    • 著者名/発表者名
      Emdad Hossain, Girija Chetty
    • 総ページ数
      323-331
    • 出版者
      Springer
  • [図書] Lecture Notes in Computer Science, 2011, Volume 6703/20112011

    • 著者名/発表者名
      Kishan G.Mehrotra, Chilukuri K.Mohan, Jae C.Oh, Pramod K.Varshney, Moonis Ali
    • 総ページ数
      348-358
    • 出版者
      Springer
  • [備考]

    • URL

      http://www.ise.osaka-sandai.ac.jp/~takahashi/

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi