• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

無人航空機による地上物体認識のための視聴覚統合

Research Project

Project/Area Number 17K00365
Research InstitutionKumamoto University

Principal Investigator

公文 誠  熊本大学, 大学院先端科学研究部(工), 准教授 (70332864)

Co-Investigator(Kenkyū-buntansha) 中臺 一博  東京工業大学, 工学院, 特任教授 (70436715)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywordsロボット聴覚 / ドローン聴覚 / 視聴覚統合 / センサフュージョン
Outline of Annual Research Achievements

異なるモダリティとして視聴覚を統合するアプローチにおいて、地上物体・音源の認識を行うにあたって、音源定位(方向)情報を利用して動画像より音源領域の検出と、その追跡技術として、繰り返しベイズ推定による結合尤度に基づく手法、ならびに演算の高速なカルマンフィルタによる近似手法を実現した。いずれの手法においても、複数の音源が互いに交差するような判別の難しい状況にあっても適切に音源追跡が可能なことを実験的にも確認した。繰り返しベイズ推定による手法では、計算アルゴリズムを工夫することで実時間実行が可能なこと、また対象を特に話者(人間)に限定することで、効果的に追尾が可能であることを示した。またカルマンフィルタでの手法では、マイクロホンアレイから見た音源方向と想定画像領域の運動の一致を手がかりに、画像中の音源の表現に依らず追尾出来る点、進展があった。ここで、画像中に対象がオクルードされることと、音源信号が雑音等でマスクされる、あるいは発話が中断する(音が途切れる)ことが等価であることから、いずれのモダリティにおいても同じアプローチが可能であることは興味深い発見であった。
また、同種のモダリティの統合については、移動する無人航空機から音源を定位するにあたって複数の無人航空機が協調して定位を行う手法についても検討を行った。
一方、複数の音がほぼ同じ方向にある場合、これらの音源方向をそれぞれ正確に求めることは難しい。特に環境中にある騒音(ファン騒音など)方向に話者が重なる場合、話者の位置のみを正確に得るには、騒音成分を除外して定位する必要がある。このため、非負値分解を利用して音信号を分離し、その情報を用いて音源方向推定を行う手法を考案した。この結果、5度程度まで接近しても話者方向が推定できるものとなった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

想定されていた、音・画像情報から未知の音源の発見し追跡するという手法については、評価実験レベルで達成しており、基礎的な展開は十分な進捗があると考えている。無人航空機で懸念される騒音についても、これを抑制すると考えられる手法を考案しており、今後の進展で無人航空機を用いた評価を行う段階まで進めることが可能であると考えており、概ね十分な進捗と判断した。
一方、本研究ではあまり想定していない、無人航空機での収録上の問題点(例えば振動や騒音等)が顕在化する可能性はあり、マルチモーダルステレオの実現の観点に焦点を当てて研究を進めることが必要である。

Strategy for Future Research Activity

H29, 30年度で開発した、音・画像情報から音源を発見し追跡するマルチモーダルステレオ技術を展開し、より現実的な状況でも利用可能なようロバスト化を進める。また無人航空機では、センサプラットフォームが移動することを想定した複数マイクロホンアレイ統合技術を踏まえ、エゴモーションを考慮した手法において視聴覚統合も展開する。なお、ここまで想定していなかった無人航空機での収録上の問題点(例えば振動や騒音等)が顕在化する場合、特にマルチモーダルステレオの実現の観点に焦点を当てて研究を進める。

Causes of Carryover

平成31年度年度の早い段階で実施予定としている無人航空機実験の消耗品(機械部品等)について、実際の実験にあわせて無駄なく購入することとしたため。使途は実験費用。

  • Research Products

    (10 results)

All 2019 2018 Other

All Int'l Joint Research (1 results) Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (7 results) (of which Int'l Joint Research: 1 results,  Invited: 2 results)

  • [Int'l Joint Research] バージニア工科大学(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      バージニア工科大学
  • [Journal Article] Recent R&D Technologies and Future Prospective of Flying Robot in Tough Robotics Challenge2019

    • Author(s)
      Kenzo Nonami, Kotaro Hoshiba, Kazuhiro Nakadai, Makoto Kumon, Hiroshi G Okuno, Yasutada Tanabe, Koichi Yonezawa, Hiroshi Tokutake, Satoshi Suzuki, Kohei Yamaguchi, Shigeru Sunada, Toshiyuki Nakata, Ryusuke Noda, Hao Liu
    • Journal Title

      Disaster Robotics, Springer

      Volume: 128 Pages: 77-142

    • DOI

      10.1007/978-3-030-05321-5_3

    • Peer Reviewed
  • [Journal Article] 音響信号処理の変遷と最先端 ロボット聴覚の視点2018

    • Author(s)
      中臺 一博
    • Journal Title

      日本音響学会誌

      Volume: 74-7 Pages: 394-400

    • DOI

      10.20697/jasj.74.7_394

    • Peer Reviewed
  • [Presentation] Close Sound Source Localization Inroporating Semi-Supervised Variational Bayesian NMF2019

    • Author(s)
      Makoto Kumon, Kai Washizaki, Kazuhiro Nakadai
    • Organizer
      Int. Symposium on System Integration (SII2019)
    • Int'l Joint Research
  • [Presentation] 複数のマイクロホンアレイを搭載した複数のUAVによる移動音源の三次元追跡2019

    • Author(s)
      山田 泰基, Daniel Gabriel, 糸山 克寿, 西田 健次, 中臺 一博
    • Organizer
      情報処理学会第81回全国大会
  • [Presentation] 屋外での移動音源追跡における動画像と音信号の統合の検討2018

    • Author(s)
      國生悠斗, 公文誠
    • Organizer
      第36回日本ロボット学会学術講演会
  • [Presentation] 繰り返しベイズ推定を用いた視聴覚統合による話者位置推定2018

    • Author(s)
      公文誠,鷲﨑海,Tomonari Furukawa
    • Organizer
      計測自動制御学会システムインテグレーション部門講演会
  • [Presentation] 複数の移動マイクロホンアレイによる移動音源の3次元定位2018

    • Author(s)
      山田 泰基, ガブリエル ダニエル, 糸山 克寿, 西田 健次, 中臺 一博
    • Organizer
      計測自動制御学会システムインテグレーション部門講演会
  • [Presentation] ロボット聴覚研究とその展開 - 災害時の迅速な要救助者発見 に向けたドローン聴覚技術開発に至るまで2018

    • Author(s)
      中臺一博
    • Organizer
      蔵前技術士会
    • Invited
  • [Presentation] ドローン聴覚~災害地での迅速な要救助者の捜索を目指して~2018

    • Author(s)
      中臺一博
    • Organizer
      ImPACTシンポジウム
    • Invited

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi