計画研究
本研究では,本計画班の構成員が開発してきた最先端の映像認識技術に立脚し,野生動物やペットなどに装着したカメラから得られた映像や,人間が撮影した映像など,これまでの映像認識技術では処理が困難な自己移動を含む映像を,安定かつ頑健に認識する技術を開発し,本領域における画像・映像情報分析のための基盤技術を構築する.本年度の実績は以下のとおりである.・B01生態学チームから提供された海鳥のGPS経路データを学習し,目的地までに至る経路の予測と,欠損部分を補完する手法をこれまで開発してきた.昨年度はこの手法の計算量を削減する手法を考案したが,まだ計算量が多く実用的ではなかった.そこで,膨大な計算量を必要とする逆強化学習に基づくこれまでの手法から,LSTMに基づく軽量な手法の開発に着手し,海鳥のGPS経路データに適用した.また人物歩行軌跡に対しては,シーン特徴量だけを用いる手法と,歩行者同士の関係性だけを用いる手法を統合し,2種類の特徴を利用して歩行軌跡予測を行う手法の開発に取り組んだ.・B01生態学チームから提供されたコウモリの音声データから3次元位置を予測する手法を前年度までに開発している.これは屋内で飛行するコウモリの3次元位置を,20chのマイクロホンアレイで録音された音声信号から,回帰によって推定する深層モデルである.これを複数フレームを同時に推定する方法を考案し,また飛行中のコウモリの数を推定するネットワークブランチを提案し,これまでの推定誤差(RMSE)が20cm程度だったものを10cm以下に減らすことが可能となった.・映像を認識する基盤技術構築のために,動作認識タスク,イベント検出,キャプショニング,質問応答に着手した.これらに共通して,時間方向の特徴量の情報をどのように取り出し,また加工すればよいのかという課題が整理された.
2: おおむね順調に進展している
本研究の目的は,自己移動を含む映像を安定かつ頑健に認識する技術を開発し,本領域における画像・映像情報分析のための基盤技術を構築することである.人間が撮影した映像などを対象とした認識技術の開発は,おおむね達成できる見込みである.前項で示したように,海鳥のGPU経路補間やコウモリの3次元位置予測などの手法の開発にまで取り組んでおり,順調に研究が進展していると考えられる.
これまで開発してきたナビゲーションに応用できる映像解析技術をさらに発展させる.2020年度には,すでに開発している軌跡処理手法を,現実的な計算量で処理できる方法を考案し,その性能を評価する.また映像を認識するタスクでは,時間方向の特徴量の情報をどのように取り出し,また加工すればよいのかという課題がある.これまでに取り組んできた研究においてこの課題の重要性が分かってきており,それを解決することでタスク横断的な解決策を図る.
すべて 2020 2019 その他
すべて 雑誌論文 (4件) (うち国際共著 1件、 査読あり 2件) 学会発表 (19件) (うち国際学会 10件、 招待講演 1件) 備考 (1件) 学会・シンポジウム開催 (1件)
Lecture Notes in Computer Science
巻: 12047 ページ: 478-488
10.1007/978-3-030-41299-9_37
生物の科学 遺伝
巻: 74 ページ: 236-240
Sensors
巻: 19 ページ: 5373
10.3390/s19245373
画像ラボ
巻: 7 ページ: 1-7
http://acml-tab2019.animal-behavior-challenge.org