2017 Fiscal Year Research-status Report

無人航空機による地上物体認識のための視聴覚統合

Research Project

Project/Area Number	17K00365
Research Institution	Kumamoto University
Principal Investigator	公文誠熊本大学, 大学院先端科学研究部(工), 准教授 (70332864)
Co-Investigator(Kenkyū-buntansha)	中臺一博東京工業大学, 工学院, 特任教授 (70436715)
Project Period (FY)	2017-04-01 – 2020-03-31
Keywords	ロボット聴覚 / 音源定位 / 視聴覚統合 / マルチロータヘリコプタ
Outline of Annual Research Achievements	本研究課題では、マルチロータヘリコプタから得られる視覚情報と聴覚情報を統合して実環境で音源位置を推定することを目的としており、初年度は異種センサ情報をマルチモーダルステレオという枠組みで統合する基礎部分の検証を行う計画であった。２９年度の具体的な実績として、地上のビデオカメラの動画像とマイクロホンアレイのマルチチャネル音信号から音源位置を統合するため、それぞれのモダリティで得られる対象（人）への方向情報を繰り返しベイズ推定の結合尤度として扱う方法を考察した。実際に体育館程度の広さの空間で複数の人が歩きまわる場合で検証した所、奥行きを含めた平面位置を得られた。また、これに関する他のアプローチとして音の反射を利用して奥行き情報を推定する方法も検討した。実環境の実験から、視覚におけるオクルージョンと同様に話者同士がマイクロホンアレイから見て同じ方向にある場合に定位が困難にになる、いわば音源方向推定におけるオクルージョンの問題があることを確認した。さらに、音源がほぼ同一方向にある場合、従来の音到来方向の推定手法では不確かな結果が得られるものの、一定の仮定の下で定位に先立って音源を分離するなどして、対象音の周波数情報を用いて定位性能を改善できることを示した。また、マルチロータヘリコプタでの応用を想定し、地上に複数の音源がある場合のマルチロータヘリコプタでの収録音による定位についても実験的検証を行い、音源分離と音源識別情報を併用することで移動する複数音源を追尾出来ることも示した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 視覚情報と聴覚情報という対象の方向のみを推定できるセンサを対象に、異なる二つの情報から対象音源の位置を推定するコンセプトに対し、不確かさを考慮した繰り返しベイズ推定手法によって複数話者の位置推定が可能であることを示した点で、重要な基礎概念部分について確認が出来た点、研究の進捗は順調であると言える。加えて、実際のシステムを構築したところ、この処理は小型ノートＰＣで実時間で実現できたことから計算量的にも効率的である点は強調したい。また、マルチロータヘリコプタでの実際の収録信号から、地上の複数話者を追尾する例において一定の定位結果を得ており、初年度として十分な準備が出来たと考えている。話者同士が交錯するような音のオクルージョンのある場合に、単純な推定・統合手法では問題のある一方、統計的音源分離手法を併用することで、音源方向推定性能が改善することを示せた点は、当初の予想よりも技術的な進展のあった点で、今後継続して研究を行う予定である。一方、音源定位の対象を話者（人）に限定している点は、今後検討が必要である。この仮定は現在のシステムでは、特に視覚情報から対象音源の候補を抽出する段階で重要であるが、マルチモーダルステレオにおいてかなり多くの事前情報を与えていることになっているため、今後はこの仮定を緩める必要がある。また、マルチロータヘリコプタでは音響信号のみを取り扱っており、画像情報の取扱は未だである。以上のことから、今後改善の必要な点はあるものの、当初予定していた基礎部分について成果が出ており、総じておおむね順調な進展を見ていると考えている。
Strategy for Future Research Activity	２９年度に提案するアプローチについて一定の条件の下で基本的な点は確認されたので、今後は条件を緩和し、より一般的な場合へと展開するとともに、最終目標であるマルチロータヘリコプタへの統合を進める。まず、対象を話者（人）に限らず一般的な対象へと広げることを考える。現状のシステムでは特に視覚情報において音源候補をどのように抽出するか、に関わっており、データアソシエーションの自明でないマルチモーダルステレオでは必ずしも可能ではない。そこで、機械学習等の手法を援用して、事前に画像上の特徴量から音源候補への対応を得る方法などを考察し、識別器の構成に取り組むこととする。また、マルチロータヘリコプタでの実験でも限られたクラスの音信号を対象として識別していたが、これについても一般化に取り組む。音源追尾にあっても、音信号が間欠的であることから、音源の同一性を利用して連続した追尾を行うこと、また異なる音を区別して除外するなど重要な技術であり、ここでも対象音の特徴量を適切に学習し識別することが効果的と考えられる。現在のマルチロータヘリコプタのシステムを音響信号に加え、視覚情報を取り扱うよう拡張する。機上の計算機で画像処理を行うのは計算量の観点から難しいので、地上基地局へ送信し、この上で処理することとなるが、伝送にも相応の帯域が必要となるため、所望の処理を行うに十分となるよう情報削減と行うなどの手法についても考察する。
Causes of Carryover	マルチロータヘリコプタにおいて、動画像処理を行うための装置等の改修に一定の費用が見込まれることから、実際に装置改造を行う予定である３０年度以降に執行することを予定して予算を繰り越すこととしました。特に、装置の選定にあたっては、機体重量、バランスをみながら安全に実験を行えることが最重要で、装置等の選定には慎重を期したものです。

Research Products
(18 results)

All 2018 2017 Other

All Int'l Joint Research (1 results) Journal Article (3 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (14 results) (of which Int'l Joint Research: 1 results, Invited: 1 results)

[Int'l Joint Research] バージニア工科大学(米国)
- Country Name
  U.S.A.
- Counterpart Institution
  バージニア工科大学
[Journal Article] マイクロホンアレイを用いた音源定位・分離ソフトウェア入門2018
- Author(s)
  中臺一博
- Journal Title
  
  システム/制御/情報
  
  Volume: 62-2 Pages: 42-49
[Journal Article] Design of UAV-Embedded Microphone Array System for Sound Source Localization in Outdoor Environments2017
- Author(s)
  Kotaro Hoshiba, Kai Washizaki, Mizuho Wakabayashi, Takahiro Ishiki, Makoto Kumon, Yoshiaki Bando, Daniel Gabriel, Kazuhiro Nakadai, and Hiroshi G. Okuno
- Journal Title
  
  Sensors
  
  Volume: 17-11 Pages: 2935
- DOI
  10.3390/s17112535
- Peer Reviewed / Open Access
[Journal Article] オープンソースコミュニティーに貢献するということ2017
- Author(s)
  中臺一博
- Journal Title
  
  映像情報メディア学会誌
  
  Volume: 71-5 Pages: 647-653
[Presentation] Quad-directional LSTMを用いた音楽音響信号修復とその評価2018
- Author(s)
  谷口亮輔, 干場功太郎, 中臺一博
- Organizer
  第80回情報処理学会全国大会
[Presentation] 可聴音を用いた周波数自動選択に基づく距離推定法の検討2018
- Author(s)
  高尾麻衣子, 干場功太郎, 中臺一博
- Organizer
  第80回情報処理学会全国大会
[Presentation] Evaluation of 2D bird localization algorithm using microphone arrays2018
- Author(s)
  Daniel Gabriel, Ryosuke Kojima, Kotaro Hoshiba, Kazuhiro Nakadai
- Organizer
  The 80th National Convention of IPSJ
[Presentation] アクティブ周波数レンジフィルタを用いた雑音にロバストな音源定位手法の提案2017
- Author(s)
  干場功太郎, 中臺一博, 公文誠, 奥乃博
- Organizer
  人工知能学会第49回AIチャレンジ研究会
[Presentation] マイクロホンアレイを有するマルチロータヘリコプタを用いた地上の複数音源の位置推定について2017
- Author(s)
  若林瑞保, 公文誠
- Organizer
  人工知能学会第49回AIチャレンジ研究会
[Presentation] UAV搭載マイクロホンアレイを用いた組み込みシステムによる音源探査性能の評価2017
- Author(s)
  干場功太郎，中臺一博，公文誠，奥乃博
- Organizer
  第３５回日本ロボット学会学術講演会
[Presentation] マルチロータヘリコプタ収録音の音源分離におけるシステムパラメータと分離性能について-GHDSSとBNP-MAPの比較2017
- Author(s)
  鷲崎海, 公文誠, 大塚琢馬, 奥乃博, 干場功太郎, 中臺一博
- Organizer
  第３５回日本ロボット学会学術講演会
[Presentation] Grid based Recursive Bayes Filterに基づくマルチロータヘリコプタによる音源探査における地図管理2017
- Author(s)
  山田健志郎, 公文誠
- Organizer
  第３５回日本ロボット学会学術講演会
[Presentation] Development of Microphone-Array-Embedded UAV for Search and Rescue Task2017
- Author(s)
  Kazuhiro Nakadai, Makoto Kumon, Hiroshi G. Okuno, Kotaro Hoshiba, Mizuho Wakabayashi, Kai Washizaki, Takahiro Ishiki, Daniel Gabriel, Yoshiaki Bando, Takayuki Morito, Ryosuke Kojima, Osamu Sugiyama
- Organizer
  International Conference on Intelligent Robots and Systems
- Int'l Joint Research
[Presentation] Bi-directional LSTM を用いた音楽音響信号修復法の提案2017
- Author(s)
  谷口亮輔, 干場功太郎, 中臺一博
- Organizer
  第３５回日本ロボット学会学術講演会
[Presentation] 可聴音を用いた周波数選択に基づく距離推定法の検討2017
- Author(s)
  高尾麻衣子, 干場功太郎, 中臺一博
- Organizer
  第３５回日本ロボット学会学術講演会
[Presentation] Quad-directional LSTMを用いた音楽音響信号修復法の提案2017
- Author(s)
  谷口亮輔, 干場功太郎, 中臺一博
- Organizer
  人工知能学会第49回AIチャレンジ研究会
[Presentation] 可聴音を用いた周波数選択に基づく距離推定法の実環境利用に向けた評価2017
- Author(s)
  高尾麻衣子, 干場功太郎, 中臺一博
- Organizer
  人工知能学会第49回AIチャレンジ研究会
[Presentation] ロボット聴覚オープンソースソフトウェアHARK の技術紹介とその展開2017
- Author(s)
  中臺一博
- Organizer
  自動車技術会エレクトロニクス部門
- Invited

2017 Fiscal Year Research-status Report

無人航空機による地上物体認識のための視聴覚統合

Principal Investigator

公文 誠 熊本大学, 大学院先端科学研究部(工), 准教授 (70332864)

Current Status of Research Progress

Reason

Research Products

[Int'l Joint Research] バージニア工科大学(米国)

Country Name

Counterpart Institution

[Journal Article] マイクロホンアレイを用いた音源定位・分離ソフトウェア入門2018

Author(s)

Journal Title

[Journal Article] Design of UAV-Embedded Microphone Array System for Sound Source Localization in Outdoor Environments2017

Author(s)

Journal Title

DOI

[Journal Article] オープンソースコミュニティーに貢献するということ2017

Author(s)

Journal Title

[Presentation] Quad-directional LSTMを用いた音楽音響信号修復とその評価2018

Author(s)

Organizer

[Presentation] 可聴音を用いた周波数自動選択に基づく距離推定法の検討2018

Author(s)

Organizer

[Presentation] Evaluation of 2D bird localization algorithm using microphone arrays2018

Author(s)

Organizer

[Presentation] アクティブ周波数レンジフィルタを用いた雑音にロバストな音源定位手法の提案2017

Author(s)

Organizer

[Presentation] マイクロホンアレイを有するマルチロータヘリコプタを用いた地上の複数音源の 位置推定について2017

Author(s)

Organizer

[Presentation] UAV搭載マイクロホンアレイを用いた組み込みシステムによる音源探査性能の評価2017

Author(s)

Organizer

[Presentation] マルチロータヘリコプタ収録音の音源分離におけるシステムパラメータと分離性能について-GHDSSとBNP-MAPの比較2017

Author(s)

Organizer

[Presentation] Grid based Recursive Bayes Filterに基づくマルチロータヘリコプタによる音源探査における地図管理2017

Author(s)

Organizer

[Presentation] Development of Microphone-Array-Embedded UAV for Search and Rescue Task2017

Author(s)

Organizer

[Presentation] Bi-directional LSTM を用いた音楽音響信号修復法の提案2017

Author(s)

Organizer

[Presentation] 可聴音を用いた周波数選択に基づく距離推定法の検討2017

Author(s)

Organizer

[Presentation] Quad-directional LSTMを用いた音楽音響信号修復法の提案2017

Author(s)

Organizer

[Presentation] 可聴音を用いた周波数選択に基づく距離推定法の実環境利用に向けた評価2017

Author(s)

Organizer

[Presentation] ロボット聴覚オープンソースソフトウェアHARK の技術紹介とその展開2017

Author(s)

Organizer

公文誠熊本大学, 大学院先端科学研究部(工), 准教授 (70332864)

[Presentation] マイクロホンアレイを有するマルチロータヘリコプタを用いた地上の複数音源の位置推定について2017