• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 研究成果報告書

アクティブオーディションによるロボット聴覚機能の向上

研究課題

  • PDF
研究課題/領域番号 21700195
研究種目

若手研究(B)

配分区分補助金
研究分野 知覚情報処理・知能ロボティクス
研究機関京都大学

研究代表者

高橋 徹  京都大学, 情報学研究科, GCOE助教 (30419494)

研究期間 (年度) 2009 – 2011
キーワードロボット聴覚 / 音源定位 / 音源分離 / 分離音声認識 / 音源追跡
研究概要

ロボットによる,音源定位,音源追跡,音源分離,分離音声認識の精度を改善した.これらの改善により,ロボットの動作により音源の方向変化に追従した音源分離が可能になった他,ロボット動作に起因するロボット自身の動作音の影響を受けにくくなり,ロボット動作中の分離音声認識が可能になった.つまり複数音源下でのアクティブオーディションのための身体動作制約が,ほとんどなくなった.音源に近づき信号対雑音比を改善し,複数音源間の方向角度差を広げるように移動し,分離音声認識精度を改善可能になった.音源とマイクロホン間に身体が入り込むような特別な場合を除き,動作中の認識精度を低下させることなく,分離音声認識が可能になった.

  • 研究成果

    (59件)

すべて 2012 2011 2010 2009 その他

すべて 雑誌論文 (7件) 学会発表 (49件) 備考 (2件) 産業財産権 (1件)

  • [雑誌論文] Efficient Blind Dereverberation and Echo Cancellation based on Independent Component Analysis for Actual Acoustic Signals2011

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      Neural Computation, MIT Press

  • [雑誌論文] Classification of Known and Unknown Environmental Sounds based on Self-organized Space using Recurrent Neural Network2011

    • 著者名/発表者名
      Zhang Yang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno
    • 雑誌名

      Advanced Robotics

      巻: 13

  • [雑誌論文] Real-Time Audio-to-Score Alignment using Particle Filter for Co-player Music Robots2010

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      Hindawi Pub.

  • [雑誌論文] Voice awareness control for a humanoid robot consistent with its body posture and movements2010

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      PALADYN Journal of Behavioral Robotics

      巻: 1 ページ: 80-88

    • DOI

      doi:10.2478/s13230-010-0009-x

  • [雑誌論文] Design and Implementation of Robot Audition System' HARK'-Open Source Software for Listening to Three Simultaneous Speakers2010

    • 著者名/発表者名
      Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, and Hiroshi Tsujino
    • 雑誌名

      Advanced Robotics

      巻: 5-6 ページ: 739-761

    • DOI

      DOI:10.1163/016918610X493561

  • [雑誌論文] Soft Missing-Feature Mask Generation for Simultaneous Speech cognition System in Robots2010

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      PALADYN Journal of Behavioral Robotics

      巻: 1 ページ: 37-47

    • DOI

      doi:10.2478/s13230-010-0005-1

  • [雑誌論文] 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚2009

    • 著者名/発表者名
      武田龍, 中臺一博, 高橋徹, 駒谷和範, 尾形哲也, 奥乃愽
    • 雑誌名

      日本ロボット学会誌

      巻: 7/8 ページ: 80-90

  • [学会発表] Complex Extension of Infinite Sparse Factor Analysis for Blind Speech Separation2012

    • 著者名/発表者名
      Kohei Nagira, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of 10th International Conference on Latent Variable Analysis and Signal Separation
    • 発表場所
      Tel-Aviv, Israel
    • 年月日
      20120312-15
  • [学会発表] A GMM Sound Source Model for Blind Speech Separation in Under-determined Condisions2012

    • 著者名/発表者名
      Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of 10th International Conference on Latent Variable Analysis and Signal Separation
    • 発表場所
      Tel-Aviv, Israel
    • 年月日
      20120312-15
  • [学会発表] Complex Infinite Sparse Factor Analysisによる周波数領域での音声信号のブラインド音源分離2012

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学
    • 年月日
      20120306-08
  • [学会発表] パーティクルフィルタを用いた動的環境下の複数音源追跡2012

    • 著者名/発表者名
      黄楊暘, 大塚琢馬, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学
    • 年月日
      20120306-08
  • [学会発表] 複数音源下での擬音語による音源選択システム2012

    • 著者名/発表者名
      山村祐介, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学
    • 年月日
      20120306-08
  • [学会発表] 発話中の方言変化に頑健な方言変換システム2012

    • 著者名/発表者名
      平山直樹, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第74回全国大会
    • 発表場所
      名古屋工業大学
    • 年月日
      20120306-08
  • [学会発表] ロボットのためのマイクアレイによる複数話者追跡2012

    • 著者名/発表者名
      高橋徹
    • 学会等名
      京都大学ICTイノベーション2012
    • 発表場所
      京都大学百周年時計台記念館2階国際交流ホールI, II, III
    • 年月日
      2012-02-17
  • [学会発表] Fast and simple iterative algorithm of Lp-norm minimization for under-determined speech separation2011

    • 著者名/発表者名
      Yasuharu Hirasawa, Naoki Yasuraoka, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of International Conference on Spoken Language Processing
    • 発表場所
      Florence, Italy
    • 年月日
      20110928-31
  • [学会発表] Environmental Sound Recognition for Robot Audition using Matching-pursuit2011

    • 著者名/発表者名
      Nobuhide Yamakawa, Toru Takahashi, Tetsuro Kitahara, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceeding of the 24th International Conference on Industrial
    • 発表場所
      Syracuse, NY
    • 年月日
      20110628-0701
  • [学会発表] Robot with Two Ears Listens to More Than Two Simultaneous Utterances by Exploiting Harmonic Structures2011

    • 著者名/発表者名
      Yasuharu Hirasawa, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceeding of the 24th International Conference on Industrial
    • 発表場所
      Syracuse, NY
    • 年月日
      20110628-0701
  • [学会発表] Cluster Self-organization of Known and Unknown Environmental Sounds using Recurrent Neural Network2011

    • 著者名/発表者名
      Zhang Yang, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno, and, Tetsuya Ogata
    • 学会等名
      Proceeding of the International Conference on Artificial Neural Networks
    • 発表場所
      Espoo, Finland
    • 年月日
      20110614-17
  • [学会発表] Infinite Sparse Factor Analysisの複素拡張による音声信号のブラインド音源分離2011

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      日本音響学会関西支部第14回若手研究者交流研究発表会
    • 発表場所
      若手優秀賞・関西支部長賞
    • 年月日
      2011-12-18
  • [学会発表] ブラインド音源分離のためのInfinite Sparse Factor Analysisの複素拡張2011

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      第34回AIチャレンジ研究会
    • 発表場所
      慶応義塾大学
    • 年月日
      2011-12-15
  • [学会発表] ノンパラメトリックベイズによる時間周波数領域における音声信号のブラインド音源分離2011

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学
    • 年月日
      2011-09-09
  • [学会発表] 調波・非調波音源モデルを用いたマイク数以上の音源分離2011

    • 著者名/発表者名
      平澤恭治, 安良岡直希, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学
    • 年月日
      2011-07-09
  • [学会発表] Introduction to Open Source Robot Audition Software HARK2011

    • 著者名/発表者名
      Kazuhiro Nakadai, Toru Takahashi, Hiroshi G. Okuno, Nakamura Keisuke, Yoshida Takami, Mizumoto Takeshi, Otsuka Takuma, Ince Gohkan
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学
    • 年月日
      2011-07-09
  • [学会発表] 実環境下での音源定位・音源検出の検討2011

    • 著者名/発表者名
      高橋徹, 中臺一博, 石井Carlos寿憲, Jani Even, 奥乃博
    • 学会等名
      日本ロボット学会第29回学術講演会
    • 発表場所
      芝浦工業大学
    • 年月日
      2011-07-09
  • [学会発表] 擬音語と環境音の音響的関係性を考慮した環境音to擬音語変換システム2011

    • 著者名/発表者名
      山川暢英, 北原鉄朗, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      2011年度人工知能学会全国大会
    • 発表場所
      岩手
    • 年月日
      2011-06-01
  • [学会発表] 累積頻度重みを適用したパーティクルフィルタによる実時間楽譜追従2011

    • 著者名/発表者名
      大塚琢馬, 中臺一博, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] 音源数同定とブラインド音源分離を同時に行うinfinite ICA2011

    • 著者名/発表者名
      柳楽浩平, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] L1ノルム最小化による劣決定音源分離のための線形計画と二次錐計画の比較評価2011

    • 著者名/発表者名
      平澤恭治, 武田龍, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] ロボット聴覚のためのMatching Pursuitによる複数環境音の同定2011

    • 著者名/発表者名
      山川暢英, 高橋徹, 北原鉄朗, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-04
  • [学会発表] Speaker Localization Using Two-Channel Microphone on the SIG-2 Humanoid Robot2011

    • 著者名/発表者名
      Uihyun Kim, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-03
  • [学会発表] Time-of-flight camera based Probabilistic Polygonal Mesh mapping2011

    • 著者名/発表者名
      Louis-Kenzo Cahier, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第73回全国大会
    • 年月日
      2011-03-02
  • [学会発表] Method of Discriminating Known and Unknown Environmental Sounds using Recurrent Neural Network2010

    • 著者名/発表者名
      Yang Zhang, Tetsuya Ogata, Shun Nishide, Toru Takahashi, Hiroshi G. Okuno
    • 学会等名
      11th International Symposium on advanced Intelligent Systems
    • 発表場所
      Okayama, JAPAN
    • 年月日
      20101208-12
  • [学会発表] Speedup and Performance Improvement of ICA-based Robot Audition by Parallel and Resampling-based Block-wise Processing(Invited paper)2010

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems
    • 発表場所
      Taiwan, Taipei
    • 年月日
      20101018-22
  • [学会発表] An Improvement in Automatic Speech Recognition Using Soft Missing Feature Masks for Robot Audition(Invitedpaper)2010

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems
    • 発表場所
      Taiwan, Taipei
    • 年月日
      20101018-22
  • [学会発表] Effects of modelling within-and between-frame temporal variations in power spectra onnon-verbal sound recognition2010

    • 著者名/発表者名
      Nobuhide Yamakawa, Tetsuro Kitahara, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of International Conference on Spoken Language Processing
    • 発表場所
      Makuhari, Japan
    • 年月日
      20100926-30
  • [学会発表] Analyzing User Utterances in Barge-in-able Spoken Dialogue System for Improving Identification Accuracy2010

    • 著者名/発表者名
      Kyoko Matsuyama, Kazunori Komatani, Ryu Takeda, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of International Conference on Spoken Language Processing
    • 発表場所
      Makuhari, Japan
    • 年月日
      20100926-30
  • [学会発表] ロボット聴覚ソフトウエアHARKとそのロボットへの適用2010

    • 著者名/発表者名
      高橋徹, 中臺一博, 奥乃博
    • 学会等名
      電気関係東海支部連合会大会
    • 年月日
      20100900
  • [学会発表] Design and Implementation of Two-level Synchronization for Interactive Music Robot2010

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of the Twenty-Fourth AAAI Conference on ArtificialIntelligence(AAAI-10)
    • 発表場所
      USA
    • 年月日
      20100711-15
  • [学会発表] Music-ensemble robot that is capable of playing the theremin while listening to the accompanied music2010

    • 著者名/発表者名
      Takuma Otsuka, Takeshi Mizumoto, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of the 23rd International Conference on Industrial
    • 発表場所
      Cordoba, Spain
    • 年月日
      20100601-04
  • [学会発表] Improving Identification Accuracy by Extending Acceptable Utterances in Spoken Dialogue System Using Barge-in Timing2010

    • 著者名/発表者名
      Kyoko Matsuyama, Kazunori Komatani, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of the 23rd International Conference on Industrial
    • 発表場所
      Cordoba, Spain
    • 年月日
      20100601-04
  • [学会発表] Upper-limit Evaluation of a Robot Audition based on ICA-BSS in Multi-source, Barge-in and Highly Reveberant Conditions2010

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE-RAS International Conference on Robotics and Automation
    • 発表場所
      Anchorage, Alaska, USA.
    • 年月日
      20100503-08
  • [学会発表] Exploiting Harmonic Structures to Improve Separating Simultaneous Speech in Under-Determined Conditions(Invitedpaper)2010

    • 著者名/発表者名
      Yasuharu Hirasawa, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems
    • 発表場所
      Taiwan, Taipei
    • 年月日
      2010-10-19
  • [学会発表] Two-level Synchronization using Particle Filter for Co-player Music Robots2010

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ-2010Workshop on Robots and Musical Expression
    • 発表場所
      Taipei(CD-ROM)
    • 年月日
      2010-10-18
  • [学会発表] Probabilistic polygonal mesh for 3D SLAM2010

    • 著者名/発表者名
      Louis-Kenzo Cahier, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-23
  • [学会発表] ロボット聴覚のためのMatching-Pursuitによる環境音の分離音認識2010

    • 著者名/発表者名
      山川暢英, 高橋徹, 北原鉄朗, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] Dynamic Recognition of Environmental Sounds with Recurrent Neural Network2010

    • 著者名/発表者名
      Zhang Yang, Tetsuya Ogata, Toru Takahashi, Hiroshi G. Okuno
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] リサンプル-ブロック処理と並列化に基づくICAの実時間実装2010

    • 著者名/発表者名
      武田龍, 中臺一博, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] Predictive Score Following user Particle Filter for Music Robots2010

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学
    • 年月日
      2010-09-22
  • [学会発表] ロボット聴覚オープンソースソフトウエアHARK2010

    • 著者名/発表者名
      奥乃博, 中臺一博, 高橋徹
    • 学会等名
      電子情報通信学会ソサイエティ大会
    • 発表場所
      大阪府立大学
    • 年月日
      2010-09-14
  • [学会発表] Improvement in Listening Capability for Humanoid Robot HRP-22010

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi. G. Okuno
    • 学会等名
      Proceedings of IEEE-RAS International Conference on Robotics and Automation 2010
    • 発表場所
      Anchorage, Alaska, USA.
    • 年月日
      2010-05-03
  • [学会発表] Missing-Feature-Theory-based Robust Simultaneous Speech Recognition System with Non-clean Speech Acoustic Model2009

    • 著者名/発表者名
      Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems 2009
    • 発表場所
      USA, St. Louis
    • 年月日
      20091211-15
  • [学会発表] Automatic Estimation of Reverberation Time with Robot Speech to Improve ICA-based Robot Audition2009

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots
    • 発表場所
      IEEE, Paris
    • 年月日
      20091207-10
  • [学会発表] Voice quality manipulation for humanoid robots consistent with their head movements2009

    • 著者名/発表者名
      Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots
    • 発表場所
      IEEE, Paris
    • 年月日
      20091207-10
  • [学会発表] Incremental Polyphonic Audio to Score Alignment using Beat Tracking for Singer Robots2009

    • 著者名/発表者名
      Takuma Otsuka, Kazumasa Murata, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems 2009
    • 発表場所
      USA, St. Louis
    • 年月日
      20091011-15
  • [学会発表] Step-size Parameter Adaptation of Multi-channel Semi-blind ICA with Piecewise Linear Model for Barge-in-able Robot Audition2009

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems 2009
    • 発表場所
      USA, St. Louis
    • 年月日
      20091011-15
  • [学会発表] ICA-basedefficient blind dereverberation and echo cancellation method for barge-in-able robot audition2009

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of 2009International Conference on Acoustics, Speech and Signal Processing 2009
    • 発表場所
      Taipei, Taiwan
    • 年月日
      20090419-24
  • [備考]

    • URL

      http://winnie.kuis.kyoto-u.ac.jp/~tall

  • [備考]

    • URL

      http://www.ise.osaka-sandai.ac.jp/~takahashi

  • [産業財産権] 音声認識装置及び音声認識装置のマスク生成方法2009

    • 発明者名
      中臺一博,高橋徹,奥乃博
    • 権利者名
      本田技研工業株式会社
    • 産業財産権番号
      公開特許公報(A)、特許公開2010-49249
    • 出願年月日
      2009-08-07

URL: 

公開日: 2013-07-31  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi