• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

アクティブオーディションによるロボット聴覚機能の向上

研究課題

研究課題/領域番号 21700195
研究機関京都大学

研究代表者

高橋 徹  京都大学, 情報学研究科, 助教 (30419494)

キーワードロボット聴覚 / 音声認識 / 音源定位 / 音源分離 / 分離音声認識 / アクティブオーディション
研究概要

研究目的は,ヒューマノイドロボットが,音声を実環境下で高精度に認識するための身体制御方法開発である.ロボット動作中でも認識可能な他,雑音としての音声が存在しても,目的とする音声を認識することが目標である.現在開発・改良している音源定位・音源分離・分離音声認識ソフトウエアを用いて音源認識ロボットの身体制御方法を開発している.
22年度計画は,ロボット動作中の音声認識の実現であった.ロボット動作中には,ロボット動作音(例えばファン音)があるため,その音は,音声認識にとって雑音となる.電源投入時のファン音など,待機時の雑音は,特定方向からの音源となる.従来方法では,雑音を音源定位し,音源分離できなかったが,特定方向の音源を無視する仕組みを導入することで動作中の認識が可能になった.
異なるマイクロホンアレイを用い,ロボットに音声認識機能を実現することも目的であった.ECMマイクロホンを搭載したヒューマノイドロボットHRP-2と,MEMSマイクロホンを搭載したロボットRobovie-R2に音声認識機能を構築した.一般にMEMSマイクロホンは,小型で個体間のばらつきが小さく,マイクロホンアレイを構成するのに適している.開発したソフトウエアは,マイクロホンの種類によらず,ロボット聴覚機能を実現可能であることを示した.また,ソフトウエアがロボット形状に対して柔軟に適応可能であることを示した.
移動音源でロボット静止中の音源定位・音源分離,または音源静止中でロボット移動中の音源定位・音源分離には,音源分離行列の適応処理が,可能な限り早く収束することが求められる.高速に収束する方法を開発し,収束時間に比べ,音源またはロボットの移動速度が遅い滑らかな移動であれば,移動中の音源定位・音源分離が可能となった.
身体動作・移動を伴う認識性能改善は,今後の課題である.

  • 研究成果

    (15件)

すべて 2011 2010

すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (7件)

  • [雑誌論文] Efficient Blind Dereverberation and Echo Cancellation based on Independent Component Analysis for Actual Acoustic Signals2011

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Neural Computation

      巻: (掲載確定)

    • 査読あり
  • [雑誌論文] Design and Implementation of Robot Audition System 'HARK'---Open Source Software for Listening to Three Simultaneous Speakers2010

    • 著者名/発表者名
      Kazuhiro Nakadai, Toru Takahashi, Hiroshi G.Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino
    • 雑誌名

      Advanced Robotics

      巻: Vol.24, No.5-6 ページ: 739-761

    • 査読あり
  • [雑誌論文] An Improvement in Automatic Speech Recognition Using Soft Missing Feature Masks for Robot Audition (Invited paper)2010

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, (IROS 2010)

      ページ: 964-969

    • 査読あり
  • [雑誌論文] Speedup and Performance Improvement of ICA-based Robot Audition by Parallel and Resampling-based Block-wise Processing (Invited paper)2010

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, (IROS 2010)

      ページ: 1949-1956

    • 査読あり
  • [雑誌論文] Exploiting Harmonic Structures to Improve Separating Simultaneous Speech in Under-Determined Conditions2010

    • 著者名/発表者名
      Yasuharu Hirasawa, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, (IROS 2010)

      巻: (Invited paper) ページ: 450-457

    • 査読あり
  • [雑誌論文] Effects of modelling within- and between-frame temporal variations in power spectra on non-verbal sound recognition2010

    • 著者名/発表者名
      Nobuhide Yamakawa, Tetsuro Kitahara, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Proceedings of International Conference on Spoken Language Processing (Interspeech 2010)

      ページ: 2342-2345

    • 査読あり
  • [雑誌論文] Improvement in Listening Capability for Humanoid Robot HRP-22010

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi.G.Okuno
    • 雑誌名

      Proceedings of IEEE-RAS International Conference on Robotics and Automation 2010, (ICRA-2010)

      ページ: 470-475

    • 査読あり
  • [雑誌論文] Upper-limit Evaluation of a Robot Audition based on ICA-BSS in Multi-source, Barge-in and Highly Reveberant Conditions2010

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • 雑誌名

      Proceedings of IEEE-RAS International Conference on Robotics and Automation 2010, (ICRA-2010)

      ページ: 4366-4371

    • 査読あり
  • [学会発表] 音源数同定とブラインド音源分離を同時に行うinfinite ICA2011

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] L1ノルム最小化による劣決定音源分離のための線形計画と二次錐計画の比較評価2011

    • 著者名/発表者名
      平澤恭治, 武田龍, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] Speaker Localization Using Two-Channel Microphone on the SIG-2 Humanoid Robot2011

    • 著者名/発表者名
      Uihyun Kim, Toru Takahashi, Tetsuya Ogata, Hiroshi G.Okuno
    • 学会等名
      情報処理学会第73回全国大会
    • 発表場所
      東京工業大学
    • 年月日
      2011-03-03
  • [学会発表] ロボット聴覚のためのMatching-Pursuitによる環境音の分離音認識2010

    • 著者名/発表者名
      山川暢英, 高橋徹, 北原鉄朗, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] リサンプル-ブロック処理と並列化に基づくICAの実時間実装2010

    • 著者名/発表者名
      武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] ロボット聴覚オープンソースソフトウエアHARK2010

    • 著者名/発表者名
      奥乃博, 中臺一博, 高橋徹
    • 学会等名
      電子情報通信学会ソサイエティ大会,依頼シンポジウムセッション,AI-1:マルチモーダル信号処理とその応用
    • 発表場所
      大阪府立大学
    • 年月日
      2010-09-14
  • [学会発表] ロボット聴覚ソフトウエアHARKとそのロボットへの応用2010

    • 著者名/発表者名
      高橋徹, 中臺一博, 奥乃博
    • 学会等名
      平成22年度電気関係学会東海支部連合大会
    • 発表場所
      中部大学(招待講演)
    • 年月日
      2010-08-30

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi