2021 Fiscal Year Research-status Report
画像と音声の相補的利用を導入した被災者探索用UAVの開発
Project/Area Number |
21K04592
|
Research Institution | Shibaura Institute of Technology |
Principal Investigator |
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 被災者探索 / ディープラーニングモデル設計 / 人体識別法 / 多重音からの音声の識別 / UAV |
Outline of Annual Research Achievements |
ドローン等のUAV(遠隔操作航空機)は災害現場での被災者探索への活用が期待されている。しかしながら現在は、画像データを本部に送付し解析すること等により探索が行われており時間がかかる。また、人体の一部画像からの判断が難しいなどの課題がある。
そこで、画像と音声を相補的に利用して、リアルタイムで自動的に被災者探索を可能とするUAVを実現するための技術基盤を開発することを目的とする。具体的には、1) 人体パーツ映像からの人体識別法研究開発、2) 多重音からの音声の識別方法の研究開発、1)および2)を実現するために、 ニューラルネットワークを基礎としたディープラーニングモデル設計及び混合ガウス分布を基礎とした統計的な手法を適用する。これにより、映像および音声によるデータを補完的に用いながら、確実な被災者探索を目指している。 2021年度では、まずドローンが災害現場での被災者探索への活用について検討した。主な検討としては、飛行中のドローンで得られるGPS位置のエラー推定である。そのGPS位置のエラー推定について研究が進み、論文の公開ができた。また、提案人体パーツ映像からの人体識別法研究開発、及び多重音からの音声の識別方法の研究開発のためのニューラルネットワークを基礎としたディープラーニングモデル設計について検討を重ねてきた。その中で、多重音からの音声の識別方法については、良い成果を得ることができ、数件の論文を公開中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度では、まずドローンが災害現場での被災者探索への活用について検討した。主な検討としては、飛行中のドローンで得られるGPS位置のエラー推定である。そのGPS位置のエラー推定について研究が進み、論文の公開ができた。
次に、人体パーツ映像からの人体識別法研究開発、及び多重音からの音声の識別方法の研究開発のためのニューラルネットワークを基礎としたディープラーニングモデル設計について検討を行ってきた。人体パーツ映像からの人体識別法研究開発についてはある一定レベルの成果を得ることができたが、今のところ期待通りの成果には繋がってない。 しかし、多重音からの音声の識別方法については、良い成果を得ることが、数件の論文を執筆中である。
|
Strategy for Future Research Activity |
今後は主に、人体パーツ映像からの人体識別法研究開発について更なる検討を重ねていき、UAV搭載カメラでの自動被災者認識の性能向上を目指していきたい。 ここで、ニューラルネットワークを基礎とした新たなディープラーニングモデルの設計を行い、人体において強い特徴のある手、足、耳等の認識はもちろんのこと、もっと特徴が薄い胸部分の一部など、細かな部分の認識について検討を行う。そして、その検討を従来手法と組合せて実装し、映像から顔、全人体に限らず、人体の細かな部分を検出される際も、被災者として扱うこととする。これまで提案してきたディープラーニングモデルに基づいた手法の場合、強い特徴のある手、足について精度が比較的に良い。しかし、特徴が薄い胸部分の一部などについては誤認識が非常に多く、精度があまりよくなく、更なる検討が必要で、今後追究する。
一方で、多重音からの音声の識別方法については、良い成果を得ることができ、それを災害地における被災者探索に応用について検討が必要である。具体的には、提案多重音からの音声の識別方法をUAV搭載小型コンピューター上での実装について検討することで、今後はそれについても進めていく。
|
Research Products
(12 results)