令和4年度は動物の行動認識について以下の研究を行った。 ・動物の位置認識および姿勢認識の精度を高めるための動画像の前処理技術として、画像セグメンテーションの高精度化の研究を行った。一般に動物の動画像は数が少なく、同じ種類の動物の動画像を大量に用意して長時間の学習を行うことが難しい。同様の問題に対して近年盛んに研究されているのがFew-shot Learningで、非常に少ない枚数の画像からいかに高精度な認識を行うことを追求している。本研究ではFew-shot Learning用に公開されているFSS-1000というデータセットを対象として、従来法の予測精度を高める2つの手法を開発した。まず、学習用の画像の背景を別のものに入れ替えたり、元の背景を加工することにより人工的に学習データを充実させたりするデータ拡張を行った。単色背景やグレースケール化など、過度に変化が少ない背景画像を用いたデータ拡張では予測精度が下がり、適切な複雑さを持つ背景画像を持ちいると予測精度が上がる傾向が見られた。次に、従来法の損失関数を動的輪郭法のエネルギー関数に置き換えて実験を行ったところ、平均して1.97%の精度改善が見られた。さらに、置き換えによって損失関数の収束が速くなり、学習コストが下がるという利点も得られた。 ・これまで主に対象としてきた飼育環境下での動物の動画像に加えて、野生動物の動画像を解析するための基礎技術として、トレイルカメラ等で撮影される動画像から実際に動物が写っているものだけを高精度に検出する研究を行った。野外撮影では一般的に背景が固定されておらず、風や流水などの影響で背景が動くことが擬陽性を高めている。本研究では動物の領域がアノテーションされた少量の動画像を基に様々な背景を人工的に合成して学習データを拡張することにより、深層学習(CNN)による検出精度を改善できることを確認した。
|