研究課題/領域番号 |
16J04552
|
研究機関 | 東京大学 |
研究代表者 |
吉橋 亮太 東京大学, 大学院情報理工学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2016-04-22 – 2019-03-31
|
キーワード | 野鳥監視 / 物体検出 / 動画認識 / コンピュータビジョン / 深層学習 / 機械学習 / 環境アセスメント |
研究実績の概要 |
野鳥の広域監視に向けた深層学習に関して,今年度は動画認識に注目して研究に取り組んだ.広域監視においては画像内に低解像度で映る鳥を正確に認識できる必要がある.この際に単独フレームでは乏しい情報を動画情報によって補うことができる可能性があり,本研究課題において動画認識は重要である.まず本年度及び来年度以降の研究で利用するために,高解像度野鳥動画データセットの構築を行った.結果として,23時間の4K動画・延べ12,000羽の鳥からなるデータセットを構築することができた.このデータは今後は得られた動画のさらなる分析,特に動画への鳥の種別の正解ラベル付けが可能であるかの検討を行う予定である. データセットの構築と並行し,深層学習による鳥検出手法の検討・実装に取り組んだ.今年度は特に深層学習の動画化に向け,静止画の最も有力な認識手法である畳み込みニューラルネットワーク(CNN)をベースに1. 静止画・動画像の処理を統合する Two-stream CNN,2. ニューラルネットワークに基づく記憶メカニズムであるLong Short-term Memory (LSTM)を利用した2つのシステムの検討を行った.Two-stream CNNによる物体検出システムは歩行者検出に関する外部の動画データセットであるCaltech Pedestrian Detection Benchmarkに適用し,性能評価を行った.LSTMは構築された4K鳥動画データセットにて評価を行った.どちらのシステムも,静止画情報のみを用いた場合に比べて検出精度の向上が確認された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画時の目標であった野鳥動画データセットの構築,深層学習による動画認識手法の実装が進んでおり,おおむね計画通りの進展があったといえる.特に撮影・データセット構築といった研究の基盤となる成果が得れた点は重要である.しかし今年度の成果の論文誌レベルでの出版に関しては,来年度以降引き続き行う.また国外の研究グループにより類似したアイディア・システムに関する論文が出版され始めており,国際競争の観点からは研究のスピードアップが必須である.
|
今後の研究の推進方策 |
野鳥の検出に加え,さらに困難な課題である鳥種の識別においても動画情報が有用であるかを調査する予定である.鳥種の識別は希少種保護の観点からも重要な課題である.まず現状の動物体検出システムを多クラス認識を可能にするよう拡張する形で検討を進め,鳥種の識別特有の問題点等を洗い出す予定である. また動物体検出に関しても,検出と追跡を深層学習により同時に行うといった新たなアイディアがあるため,これに関して引き続き検討を行う. さらに今年度の成果に関して論文としてまとめ,国際会議・論文誌への投稿を行う予定である.この際に構築したシステムのパラメータ調整・ブラッシュアップも行う予定である.
|