研究実績の概要 |
処理の性能向上を目指して,深層学習を利用した動物検出・識別手法を検討した. 動物識別では,個体識別に顔情報を利用することを想定し,人の顔を多数学習したモデル(FaceNet,VGGFace)と一般画像を多数学習したモデル(VGG16,VGG19,ResNet50)を用意した.これらのモデルを本課題に転移学習により適用し,性能を評価した.事前には,人の顔を学習したモデルの方が性能が高いと予想していたが,実験の結果,一般画像を学習したモデルの方が20ポイント程度大幅に性能がよく,90%以上の識別率が達成可能であることが分かった.この差がどこから生じているのか確認するために,学習済みモデルの入力画像に対する内部の反応状態(ヒートマップ)を可視化した所,一般画像を学習したモデルでは,鼻や眼といった動物の顔の造作に強く反応していたのに対して,人の顔を学習したモデルでは,明確に反応している部位が見られなかった.一方,人の顔を学習したモデルに人の顔の画像を与えた場合,人の顔の造作に反応していた.これらのことから,動物と人との顔の造作の違いや位置の違いが影響していることが示唆された.このことから,動物の顔を多数学習したモデルを構築できれば,識別精度を更に向上させられる可能性を示した. 動物検出では,YOLOv3を使った検出手法を導入した.この手法は,深層学習を利用したものであるが,軽量な実装が提供されており,スマートフォン上でも実行できるものである.開発手法のシステム化を目指して,実際にスマートフォン上への実装を行った.検出精度は,良好な照明環境下では十分な精度であったが,暗い照明環境下や手前に障害物があるような環境下では検出漏れが生じた.また,検出速度についても,毎秒1-2フレーム程度となり,より高速化する必要があることが分かった.
|