2012 Fiscal Year Annual Research Report

聴覚インタラクションの実現に向けた実環境ロボット聴覚の研究

Publicly Offered Research

Project Area	Founding a creative society via collaboration among humans and robots
Project/Area Number	24118702
Research Institution	Tokyo Institute of Technology
Principal Investigator	中臺一博東京工業大学, 情報理工学(系)研究科, 教授 (70436715)
Project Period (FY)	2012-04-01 – 2014-03-31
Keywords	ロボット聴覚 / 音環境理解 / 自己雑音抑圧 / 人ロボット共生学 / マイクロホンアレイ処理
Outline of Annual Research Achievements	人とロボットが実環境で，より自然にインタラクションを行う「人ロボット共生のための聴覚インタラクション」実現のため，実環境ロボット聴覚技術を開発することを目的とし，当該年度は，以下の２点の基礎技術の洗練化・高機能化に焦点を絞って研究を行った．センサ同期技術：ロボビー W の自己発生雑音と動作指令値の時刻ずれの性質を利用して，指令値ベースの自己雑音抑圧手法の提案を新規に行った．指令値は観測値よりも前に得られるため，従来の観測値ベース法より高速に自己雑音推定が可能であることをシミュレーションにより示した．また，同じ指令値／観測値に対する自己雑音の揺れに対処できる自己雑音推定のモデル化が可能かどうか予備検討を行った．この予備検討結果に基づき，H25年度は，動作情報自体を不要とする汎用性が高い自己雑音推定手法を構築予定である．実環境ロボット聴覚技術：混合音を扱うため，独立成分分析手法の発展形として，近年注目を浴びている音源分離手法である独立ベクトル分析(IVA) とマイクロホンアレイ分離処理に適した特徴量として知られるメルスケール対数スペクトラム(MSLS)を用いた音声識別器を構築した．この識別器を室内設置型マイクロホンアレイと合わせて利用することにより，話者名，話者位置，各話者の発話時刻を同時推定できるシステムを構築した．また，５名の話者が自由発話する状況で，雑音頑健性が高いことで知られるMUSIC法と比較し，良好な性能であることを実証した．さらに，話者名，話者位置，各話者の発話時刻を表示できるオフライン版ビューワーを構築した．ビューワのオンライン処理化，タブレットデバイス等での音の可視化をH25年度は進める予定である．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 当該年度の目標は，ロボット動作に対応する基礎技術を確立するとともに，室内設置型マイクロホンアレイを用いて，実環境でロバストに定位・分離・認識を行い，結果を視覚化するシステムを構築することであった．ロボット動作に対しては，自己雑音と動作の非同期性を検証し，そのモデル化が可能である点まで明らかになった．また，実環境ロボット聴覚技術は，５名の話者が自由発話する状況でも，話者名，話者位置，各話者の発話時刻を同時推定できるプロトタイプシステムをビューワーとともに構築した．以上より，当初の目標がほぼ達成できたことから，計画通り研究を進めることができたと考える．
Strategy for Future Research Activity	H25年度は，自己動作雑音と動作に関する予備検討に基づき，近年注目を集めているノンパラメトリックベイジアンモデルを用いて，動作情報自体を不要とする汎用性が高い自己雑音推定手法を構築，その有効性を実証することを目指す．動作情報が不要となれば，特別なセンサを持たないロボットでも動作音抑圧が可能となるため，学術的にも，実用的にも価値が高い技術が構築できる可能性があるため，この技術の確立に注力する予定である．また，実環境ロボット聴覚技術については，話者名，話者位置，各話者の発話時刻取得のオンライン化，ポータブルな可視化技術の確立も同時に進める予定である．

Research Products
(18 results)

All 2013 2012 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (12 results) (of which Invited: 1 results) Remarks (2 results)

[Journal Article] クワドロコプター搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上2013
- Author(s)
  奥谷啓太, 吉田尚水, 中村圭佑, 中臺一博
- Journal Title
  
  日本ロボット学会誌
  
  Volume: 31(7-8) Pages: 掲載決定
- Peer Reviewed
[Journal Article] 混合音を聞き分けるセンシング技術2012
- Author(s)
  奥乃博, 中臺一博, 水本武志
- Journal Title
  
  電子情報通信学会学会誌
  
  Volume: 95 (5) Pages: 401-405
- Peer Reviewed
[Journal Article] Audio-Visual Voice Activity Detection Based on an Utterance State Transition Model2012
- Author(s)
  T. Yoshida, K. Nakadai
- Journal Title
  
  Advanced Robotics
  
  Volume: 26 (10) Pages: 1183-1201
- DOI
  DOI:10.1080/01691864.2012.687152
- Peer Reviewed
[Journal Article] SLAM-based Online Calibration for Asynchronous Microphone Array2012
- Author(s)
  H. Miura, T. Yoshida, K. Nakamura, K. Nakadai
- Journal Title
  
  Advanced Robotics
  
  Volume: 26 (17) Pages: 1941-1965
- DOI
  DOI:10.1080/01691864.2012.728690
- Peer Reviewed
[Presentation] Active Audio-Visual Integration for Robots2013
- Author(s)
  K. Nakadai, T. Yoshida
- Organizer
  The 2nd Symposium on Binaural Active Audition for Humanoid Robots (BINAAHR)
- Place of Presentation
  京都大学（京都）
- Year and Date
  2013-03-18 – 2013-03-18
- Invited
[Presentation] チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定2013
- Author(s)
  坂東宣昭, 水本武志, 中臺一博, 奥乃博
- Organizer
  情報処理学会第75回全国大会
- Place of Presentation
  東北大学（宮城）
- Year and Date
  2013-03-06 – 2013-03-08
[Presentation] 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討2013
- Author(s)
  黄楊暘, 大塚琢馬, 中臺一博, 奥乃博
- Organizer
  情報処理学会第75回全国大会
- Place of Presentation
  東北大学（宮城）
- Year and Date
  2013-03-06 – 2013-03-08
[Presentation] ロボットを対象とした動作指令値ベース動作雑音抑圧手法の検討2012
- Author(s)
  手塚大貴，吉田尚水，中臺一博
- Organizer
  第13回計測自動制御学会システムインテグレーション部門講演会
- Place of Presentation
  福岡国際会議場(福岡)
- Year and Date
  2012-12-18 – 2012-12-20
[Presentation] Active Audio-Visual Integration for Voice Activity Detection based on a Causal Bayesian Network2012
- Author(s)
  T. Yoshida, K. Nakadai
- Organizer
  the 2012 IEEE RAS International Conference on Humanoid Robots (Humanoids 2012)
- Place of Presentation
  大阪産業創造館（大阪）
- Year and Date
  2012-11-29 – 2012-12-01
[Presentation] 視覚情報との統合による音声区間検出および音声認識精度向上の検討2012
- Author(s)
  黄楊暘, 大塚琢馬, 中臺一博, 奥乃博
- Organizer
  人工知能学会第36回 AI-Challenge 研究会
- Place of Presentation
  慶応大学（東京）
- Year and Date
  2012-11-15 – 2012-11-15
[Presentation] アクティブ視聴覚統合による発話区間検出の検討: 因果モデルベースアプローチ2012
- Author(s)
  吉田尚水，中臺一博
- Organizer
  人工知能学会第36回 AI-Challenge 研究会
- Place of Presentation
  慶応大学（東京）
- Year and Date
  2012-11-15 – 2012-11-15
[Presentation] グループ会話支援のためのワイヤレスマイクロホンアレイ「くらげクン2号」の開発2012
- Author(s)
  ムンソンウン，高木健太郎，釜島力，中臺一博，大武美保子
- Organizer
  人工知能学会第36回 AI-Challenge 研究会
- Place of Presentation
  慶応大学（東京）
- Year and Date
  2012-11-15 – 2012-11-15
[Presentation] Outdoor Auditory Scene Analysis Using a Moving Microphone Array Embedded in a Quadrocopter2012
- Author(s)
  K. Okutani, T. Yoshida, K. Nakamura, K. Nakadai
- Organizer
  2012 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2012),
- Place of Presentation
  ビラモウラ（ポルトガル）
- Year and Date
  2012-10-07 – 2012-10-12
[Presentation] マイクロホンアレイを用いた複数人対話からの発話区間検出および話者方向推定の評価手法2012
- Author(s)
  黄楊暘, 大塚琢馬, 中臺一博, 奥乃博
- Organizer
  第30回日本ロボット学会学術講演会
- Place of Presentation
  札幌コンベンションセンター（北海道）
- Year and Date
  2012-09-17 – 2012-09-20
[Presentation] クワドロコプタを用いた屋外音環境理解の逐次雑音推定による向上2012
- Author(s)
  奥谷啓太，吉田尚水，中村圭佑，中臺一博
- Organizer
  第30回日本ロボット学会学術講演会
- Place of Presentation
  札幌コンベンションセンター（北海道）
- Year and Date
  2012-09-17 – 2012-09-20
[Presentation] ロボット聴覚のための因果モデルを用いたアクティブ視聴覚統合発話区間検出の検討2012
- Author(s)
  吉田尚水，中臺一博
- Organizer
  第30回日本ロボット学会学術講演会
- Place of Presentation
  札幌コンベンションセンター（北海道）
- Year and Date
  2012-09-17 – 2012-09-20
[Remarks] ロボット聴覚オープンソースソフトウェアHARKのページ
- URL
  http://winnie.kuis.kyoto-u.ac.jp/
[Remarks] 東京工業大学大学院情報理工学研究科中臺研究室HP
- URL
  http://www.cyb.mei.titech.ac.jp/nakadai/

2012 Fiscal Year Annual Research Report

聴覚インタラクションの実現に向けた実環境ロボット聴覚の研究

Principal Investigator

中臺 一博 東京工業大学, 情報理工学(系)研究科, 教授 (70436715)

Current Status of Research Progress

Reason

Research Products

[Journal Article] クワドロコプター搭載のマイクロホンアレイを用いた屋外音環境理解の逐次雑音推定による向上2013

Author(s)

Journal Title

[Journal Article] 混合音を聞き分けるセンシング技術2012

Author(s)

Journal Title

[Journal Article] Audio-Visual Voice Activity Detection Based on an Utterance State Transition Model2012

Author(s)

Journal Title

DOI

[Journal Article] SLAM-based Online Calibration for Asynchronous Microphone Array2012

Author(s)

Journal Title

DOI

[Presentation] Active Audio-Visual Integration for Robots2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ 位置推定2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 話者ダイアライゼーションシステムのための音声区間検出および到来方向推定の精度向上の検討2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ロボットを対象とした動作指令値ベース動作雑音抑圧手法の検討2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Active Audio-Visual Integration for Voice Activity Detection based on a Causal Bayesian Network2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 視覚情報との統合による音声区間検出および音声認識精度向上の検討2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] アクティブ視聴覚統合による発話区間検出の検討: 因果モデルベースアプローチ2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] グループ会話支援のためのワイヤレスマイクロホンアレイ「くらげクン2号」の開発2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Outdoor Auditory Scene Analysis Using a Moving Microphone Array Embedded in a Quadrocopter2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] マイクロホンアレイを用いた複数人対話からの発話区間検出 および話者方向推定の評価手法2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] クワドロコプタを用いた屋外音環境理解の逐次雑音推定による向上2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ロボット聴覚のための因果モデルを用いたアクティブ視聴覚統合発話区間検出の検討2012

Author(s)

Organizer

Place of Presentation

中臺一博東京工業大学, 情報理工学(系)研究科, 教授 (70436715)

[Presentation] チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定2013

[Presentation] マイクロホンアレイを用いた複数人対話からの発話区間検出および話者方向推定の評価手法2012

[Remarks] 東京工業大学大学院情報理工学研究科中臺研究室HP