• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

聴覚インタラクションの実現に向けた実環境ロボット聴覚の研究

Publicly Offered Research

Project AreaFounding a creative society via collaboration among humans and robots
Project/Area Number 24118702
Research InstitutionTokyo Institute of Technology

Principal Investigator

中臺 一博  東京工業大学, 情報理工学(系)研究科, 教授 (70436715)

Project Period (FY) 2012-04-01 – 2014-03-31
Keywordsロボット聴覚 / 音環境理解 / 自己雑音抑圧 / 人ロボット共生学 / マイクロホンアレイ処理
Outline of Annual Research Achievements

人とロボットが実環境で,より自然にインタラクションを行う「人ロボット共生のための聴覚インタラクション」実現のため,実環境ロボット聴覚技術を開発することを目的とし,当該年度は,以下の2点の基礎技術の洗練化・高機能化に焦点を絞って研究を行った.
センサ同期技術:ロボビー W の自己発生雑音と動作指令値の時刻ずれの性質を利用して,指令値ベースの自己雑音抑圧手法の提案を新規に行った.指令値は観測値よりも前に得られるため,従来の観測値ベース法より高速に自己雑音推定が可能であることをシミュレーションにより示した.また,同じ指令値/観測値に対する自己雑音の揺れに対処できる自己雑音推定のモデル化が可能かどうか予備検討を行った.この予備検討結果に基づき,H25年度は,動作情報自体を不要とする汎用性が高い自己雑音推定手法を構築予定である.
実環境ロボット聴覚技術:混合音を扱うため,独立成分分析手法の発展形として,近年注目を浴びている音源分離手法である独立ベクトル分析(IVA) とマイクロホンアレイ分離処理に適した特徴量として知られるメルスケール対数スペクトラム(MSLS)を用いた音声識別器を構築した.この識別器を室内設置型マイクロホンアレイと合わせて利用することにより,話者名,話者位置,各話者の発話時刻を同時推定できるシステムを構築した.また,5名の話者が自由発話する状況で,雑音頑健性が高いことで知られるMUSIC法と比較し,良好な性能であることを実証した.さらに,話者名,話者位置,各話者の発話時刻を表示できるオフライン版ビューワーを構築した.ビューワのオンライン処理化,タブレットデバイス等での音の可視化をH25年度は進める予定である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当該年度の目標は,ロボット動作に対応する基礎技術を確立するとともに,室内設置型マイクロホンアレイを用いて,実環境でロバストに定位・分離・認識を行い,結果を視覚化するシステムを構築することであった.ロボット動作に対しては,自己雑音と動作の非同期性を検証し,そのモデル化が可能である点まで明らかになった.また,実環境ロボット聴覚技術は,5名の話者が自由発話する状況でも,話者名,話者位置,各話者の発話時刻を同時推定できるプロトタイプシステムをビューワーとともに構築した.以上より,当初の目標がほぼ達成できたことから,計画通り研究を進めることができたと考える.

Strategy for Future Research Activity

H25年度は,自己動作雑音と動作に関する予備検討に基づき,近年注目を集めているノンパラメトリックベイジアンモデルを用いて,動作情報自体を不要とする汎用性が高い自己雑音推定手法を構築,その有効性を実証することを目指す.動作情報が不要となれば,特別なセンサを持たないロボットでも動作音抑圧が可能となるため,学術的にも,実用的にも価値が高い技術が構築できる可能性があるため,この技術の確立に注力する予定である.また,実環境ロボット聴覚技術については,話者名,話者位置,各話者の発話時刻取得のオンライン化,ポータブルな可視化技術の確立も同時に進める予定である.

  • Research Products

    (18 results)

All 2013 2012 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (12 results) (of which Invited: 1 results) Remarks (2 results)

  • [Journal Article] クワドロコプター搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上2013

    • Author(s)
      奥谷啓太, 吉田尚水, 中村圭佑, 中臺一博
    • Journal Title

      日本ロボット学会誌

      Volume: 31(7-8) Pages: 掲載決定

    • Peer Reviewed
  • [Journal Article] 混合音を聞き分けるセンシング技術2012

    • Author(s)
      奥乃 博, 中臺 一博, 水本 武志
    • Journal Title

      電子情報通信学会学会誌

      Volume: 95 (5) Pages: 401-405

    • Peer Reviewed
  • [Journal Article] Audio-Visual Voice Activity Detection Based on an Utterance State Transition Model2012

    • Author(s)
      T. Yoshida, K. Nakadai
    • Journal Title

      Advanced Robotics

      Volume: 26 (10) Pages: 1183-1201

    • DOI

      DOI:10.1080/01691864.2012.687152

    • Peer Reviewed
  • [Journal Article] SLAM-based Online Calibration for Asynchronous Microphone Array2012

    • Author(s)
      H. Miura, T. Yoshida, K. Nakamura, K. Nakadai
    • Journal Title

      Advanced Robotics

      Volume: 26 (17) Pages: 1941-1965

    • DOI

      DOI:10.1080/01691864.2012.728690

    • Peer Reviewed
  • [Presentation] Active Audio-Visual Integration for Robots2013

    • Author(s)
      K. Nakadai, T. Yoshida
    • Organizer
      The 2nd Symposium on Binaural Active Audition for Humanoid Robots (BINAAHR)
    • Place of Presentation
      京都大学(京都)
    • Year and Date
      2013-03-18 – 2013-03-18
    • Invited
  • [Presentation] チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ 位置推定2013

    • Author(s)
      坂東 宣昭, 水本 武志, 中臺 一博, 奥乃 博
    • Organizer
      情報処理学会第75回全国大会
    • Place of Presentation
      東北大学(宮城)
    • Year and Date
      2013-03-06 – 2013-03-08
  • [Presentation] 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討2013

    • Author(s)
      黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博
    • Organizer
      情報処理学会第75回全国大会
    • Place of Presentation
      東北大学(宮城)
    • Year and Date
      2013-03-06 – 2013-03-08
  • [Presentation] ロボットを対象とした動作指令値ベース動作雑音抑圧手法の検討2012

    • Author(s)
      手塚 大貴,吉田 尚水,中臺 一博
    • Organizer
      第13回計測自動制御学会システムインテグレーション部門講演会
    • Place of Presentation
      福岡国際会議場(福岡)
    • Year and Date
      2012-12-18 – 2012-12-20
  • [Presentation] Active Audio-Visual Integration for Voice Activity Detection based on a Causal Bayesian Network2012

    • Author(s)
      T. Yoshida, K. Nakadai
    • Organizer
      the 2012 IEEE RAS International Conference on Humanoid Robots (Humanoids 2012)
    • Place of Presentation
      大阪産業創造館(大阪)
    • Year and Date
      2012-11-29 – 2012-12-01
  • [Presentation] 視覚情報との統合による音声区間検出および音声認識精度向上の検討2012

    • Author(s)
      黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博
    • Organizer
      人工知能学会 第36回 AI-Challenge 研究会
    • Place of Presentation
      慶応大学(東京)
    • Year and Date
      2012-11-15 – 2012-11-15
  • [Presentation] アクティブ視聴覚統合による発話区間検出の検討: 因果モデルベースアプローチ2012

    • Author(s)
      吉田 尚水,中臺 一博
    • Organizer
      人工知能学会 第36回 AI-Challenge 研究会
    • Place of Presentation
      慶応大学(東京)
    • Year and Date
      2012-11-15 – 2012-11-15
  • [Presentation] グループ会話支援のためのワイヤレスマイクロホンアレイ「くらげクン2号」の開発2012

    • Author(s)
      ムン ソンウン,高木 健太郎,釜島 力,中臺 一博,大武 美保子
    • Organizer
      人工知能学会 第36回 AI-Challenge 研究会
    • Place of Presentation
      慶応大学(東京)
    • Year and Date
      2012-11-15 – 2012-11-15
  • [Presentation] Outdoor Auditory Scene Analysis Using a Moving Microphone Array Embedded in a Quadrocopter2012

    • Author(s)
      K. Okutani, T. Yoshida, K. Nakamura, K. Nakadai
    • Organizer
      2012 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2012),
    • Place of Presentation
      ビラモウラ(ポルトガル)
    • Year and Date
      2012-10-07 – 2012-10-12
  • [Presentation] マイクロホンアレイを用いた複数人対話からの発話区間検出 および話者方向推定の評価手法2012

    • Author(s)
      黄 楊暘, 大塚 琢馬, 中臺 一博, 奥乃 博
    • Organizer
      第30回日本ロボット学会学術講演会
    • Place of Presentation
      札幌コンベンションセンター(北海道)
    • Year and Date
      2012-09-17 – 2012-09-20
  • [Presentation] クワドロコプタを用いた屋外音環境理解の逐次雑音推定による向上2012

    • Author(s)
      奥谷 啓太,吉田 尚水,中村 圭佑,中臺 一博
    • Organizer
      第30回日本ロボット学会学術講演会
    • Place of Presentation
      札幌コンベンションセンター(北海道)
    • Year and Date
      2012-09-17 – 2012-09-20
  • [Presentation] ロボット聴覚のための因果モデルを用いたアクティブ視聴覚統合発話区間検出の検討2012

    • Author(s)
      吉田 尚水,中臺 一博
    • Organizer
      第30回日本ロボット学会学術講演会
    • Place of Presentation
      札幌コンベンションセンター(北海道)
    • Year and Date
      2012-09-17 – 2012-09-20
  • [Remarks] ロボット聴覚オープンソースソフトウェアHARKのページ

    • URL

      http://winnie.kuis.kyoto-u.ac.jp/

  • [Remarks] 東京工業大学 大学院 情報理工学研究科 中臺研究室HP

    • URL

      http://www.cyb.mei.titech.ac.jp/nakadai/

URL: 

Published: 2018-02-02  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi