本研究では,本計画班の構成員が開発してきた最先端の映像認識技術に立脚し,野生動物やペットなどに装着したカメラから得られた映像や,人間が撮影した映像など,これまでの映像認識技術では処理が困難な自己移動を含む映像を,安定かつ頑健に認識する技術を開発し,本領域における画像・映像情報分析のための基盤技術を構築することを目的とする.本年度の実績は以下のとおりである. ・前年度までに,海鳥のGPS経路データに対して,目的地までに至る経路の予測と,欠損部分を補完する手法を開発してきた.それと並行して,人物歩行軌跡に対して歩行軌跡予測を行う手法も開発を行ってきた.本年度はこれらの知見を統合し,人物歩行軌跡に対して,欠損部分を補完する手法を開発した.双方向LSTMを拡張し,順方向と逆方向から欠損部分の情報を推定するモデルを構築し,複数のデータセットで効果を検証した. ・前年度までに開発してきたコウモリの音声データから3次元位置を予測する手法の定量評価を行った.これは屋内で飛行するコウモリの3次元位置を,20chのマイクロホンアレイで録音された音声信号から,回帰によって推定する深層モデルである.これを複数フレームを同時に推定する方法と,飛行中のコウモリの数を推定する方法についての検証実験を行い,キクガシラコウモリの実際の軌跡に対して学習誤差が20mm,テスト誤差が200mm程度であるという実験結果が得られた.またシミュレーション実験により,飛行数推定手法の効果を検証した. ・前年度から引き続き,映像認識基盤技術として,時間方向特徴を抽出・加工する手法の開発を行った.動作認識に対して3次元CNNを適用する際の計算量を低減するために,2次元CNN特徴量をシフトする手法に着目し,様々なモデルで効果を検証した.またイベント検出を行うための弱教師付き学習手法としてプロトタイプに基づく手法を考案し,性能を検証した.
|