当該年度の実施計画では,低解像度の動画で動き特徴により識別を行うためにRecurrent neural networksを用いた深層学習手法の開発に取り組む予定であった.実際に,昨年度にLong Short-term Memory networks (LSTM)を用いて5フレームの動画からの検出手法が,静止画のみのCNN出力の平均をとるベースラインと比較して,3~5%ポイント上回る結果が得られた.今年度はこれの改良によりベースラインから21.7%ポイントの性能向上を得た.さらにLSTMの部分を畳込LSTMに拡張し,相関フィルタを用いて追跡も行うことで,物体を追跡しながらその動きパターンにより鳥か否かを識別する手法を開発し,この手法が最終的に32%ポイントの性能向上を達成した.鳥のみならずドローンでも検証し,最新の既存手法に比べ明確な性能改善を確認した.この手法は訓練データがあれば追跡器としても検出器としても利用でき,それぞれが最新の手法に劣らない性能を有する.この成果はAAAIとCVPRへ投稿したが査読者からは評価されたものの残念ながら不採択となった.これは,学習アルゴリズムの性能は学習データとテストデータの関係に依存するので,学習データがマイナーなものであると国際会議では採択されにくい傾向があるためと考える.現在は英文雑誌に投稿を準備しており,同手法は風力発電の民間企業がライセンス化を希望している.また,関連する画像認識に関する論文が英文雑誌や国内会議にそれぞれ採択され,国際会議に投稿中のものも一件ある.
本プロジェクトを通じ,深層学習による動画から物体の検出と分類に取り組んだ.当初掲げた深層学習と動き特徴による(1)検出性能の向上,(2)低解像度動画での識別,(3)バードストライクへの寄与,を全て達成した.
|