• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

アクティブ視聴覚統合による動的変化環境下での音環境認識

Research Project

Project/Area Number 22700165
Research InstitutionTokyo Institute of Technology

Principal Investigator

中臺 一博  東京工業大学, 大学院・情報理工学研究科, 連携教授 (70436715)

Keywords視聴覚統合 / 音声認識 / 発話区間検出 / ロボット聴覚 / 音源同定 / 雑音抑圧 / ソフトウェアアーキテクチャ / 信頼度付特徴量
Research Abstract

平成23年度は、平成22年度の成果をベースに,アクティブに情報量レベルを制御するロボット制御方式に重点を置いて研究を行い,ほぼ予定通りに研究を進めることができた.
1.視聴覚統合モデルの構築
平成22年度に予測された情報量の信頼度が大きく異なる場合にはモダリティ統合よりもモダリティ選択が有効であるという知見について実際に実機ロボットを用いたデータを用いて検証を行い,その結果を英文ジャーナル論文としてまとめた(採択済).さらに,アクティブに情報量レベルを制御するロボット制御方式について,因果推論ベイズを用いたフレームワークを考案し,その有効性を検証中である.平成24年度構築予定の実機ロボット用視聴覚統合システムフレームワークに採用予定である.
2.自己発生音抑圧
平成23年度に提案したテンプレートベース法でテンプレートを適応的に構築するアルゴリズムを考案し,その有効性を検証した.平成24年度は,提案アルゴリズムをオープンソースソフトHARKに導入し,上記1との統合を図る予定である.
3.音源同定・環境音認識
平成23年度は音楽認識に焦点を絞ってビート追跡の研究を行った.平成24年度は音源同定技術と統合を目指す.
4.ロボット実機・シミュレータ
台車型ヒューマノイドロボットHearboを用いて、提案した視聴覚統合モデルが適用できるようROS化を行った.平成24年度は,実際にHearboを用いて統合システムの検証を行う.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究テーマは大きく4つの項目からなっており,それらが,最終年度で統合されるという計画となっている.平成24年度にこれら4項目で得られた成果が統合できるレベルにまで進捗しているため,おおむね順調に進展しているといえる。

Strategy for Future Research Activity

平成24年度は,3年間の集大成として,実機ロボットに構築した手法を統合し,提案フレームワークの有効性を実証する.具体的には,視聴覚統合モデルについては,因果推論ベイズを用いたフレームワークを実機ロボット用視聴覚統合システムに適用する予定である。この際に,オープンソースソフトHARKへ導入される自己発生音抑圧法,音源同定技術と統合する.ロボットの実機には,台車型ヒューマノイドロボットHearboを用いる.

  • Research Products

    (11 results)

All 2012 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (9 results)

  • [Journal Article] Whole Body Motion Noise Cancellation of a Robot for Improved Automatic Speech Recognition2011

    • Author(s)
      G. Ince, K. Nakadai, T. Rodemann, H. Tsujino, J. Imura
    • Journal Title

      Advanced Robotics

      Volume: 25 Pages: 1405-1426

    • DOI

      10.1163/016918611X579448

    • Peer Reviewed
  • [Journal Article] Ego-motion Noise Cancellation of a Robot using Missing Feature Masks2011

    • Author(s)
      G. Ince, K. Nakadai, T. Rodemann, H. Tsujino, J. Imura
    • Journal Title

      Applied Intelligence

      Volume: 34 Pages: 360-371

    • DOI

      10.1007/s10489-011-0285-0

    • Peer Reviewed
  • [Presentation] Audio-Visual Integration for voice activity detection2012

    • Author(s)
      T. Yoshida, K. Nakadai
    • Organizer
      First Symposium on Binaural Active Audition for Humanoid Robots
    • Place of Presentation
      パリ(フランス)(招待講演)
    • Year and Date
      2012-02-27
  • [Presentation] Incremental Learning for Ego Noise Estimation of a Robot2011

    • Author(s)
      G. Ince, K. Nakadai, T. Rodemann, J. Imura, K. Nakamura, H. Nakajima
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011)
    • Place of Presentation
      サンフランシスコ(アメリカ)
    • Year and Date
      20110926-20110927
  • [Presentation] Assessment of Single-channel Ego Noise Estimation Methods2011

    • Author(s)
      G. Ince, K. Nakadai, T. Rodemann, J. Imura, K. Nakamura, H. Nakajima
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011)
    • Place of Presentation
      サンフランシスコ(アメリカ)
    • Year and Date
      20110926-20110927
  • [Presentation] SLAM-based Online Calibration of Asynchronous Microphone Array for Robot Audition2011

    • Author(s)
      H. Miura, T. Yoshida, K. Nakamura, K. Nakadai
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011)
    • Place of Presentation
      サンフランシスコ(アメリカ)
    • Year and Date
      20110926-20110927
  • [Presentation] クワドロコプターを使った屋外音環境の収録と解析2011

    • Author(s)
      奥谷啓太, 吉田尚水, 中村圭佑, 中臺一博
    • Organizer
      第12回計測自動制御学会システムインテグレーション部門講演会,計測自動制御学会
    • Place of Presentation
      京都大学(京都)
    • Year and Date
      2011-12-24
  • [Presentation] SLAMに基づく非同期分散マイクロホンアレイのキャリブレーションの評価2011

    • Author(s)
      三浦弘樹, 吉田尚水, 中村圭佑, 中臺一博
    • Organizer
      人工知能学会第34回AI-Challenge研究会
    • Place of Presentation
      慶応大学(東京都)
    • Year and Date
      2011-12-15
  • [Presentation] SLAMとビームフォーミングによる非同期分散マイクロホンアレイのキャリブレーション2011

    • Author(s)
      三浦弘樹, 吉田尚水, 中村圭佑, 中臺一博
    • Organizer
      第29回日本ロボット学会学術講演会,日本ロボット学会
    • Place of Presentation
      芝浦工業大学(東京都)
    • Year and Date
      2011-09-09
  • [Presentation] ロボットのための情報量レベルに基づくアクティブ視聴覚統合の検討2011

    • Author(s)
      吉田尚水, 中村圭佑, 中臺一博
    • Organizer
      第29回日本ロボット学会学術講演会,日本ロボット学会
    • Place of Presentation
      芝浦工業大学(東京都)
    • Year and Date
      2011-09-09
  • [Presentation] Assessment of General Applicability of Ego Noise Estimation-Applications to Automatic Speech Recognition and Sound Source Localization-2011

    • Author(s)
      G. Ince, K. Nakamura, F. Asano, H. Nakajima, K. Nakadai
    • Organizer
      IEEE-RAS International Conference on Robotics and Automation (ICRA 2011)
    • Place of Presentation
      上海(中国)
    • Year and Date
      2011-05-11

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi