2017 Fiscal Year Annual Research Report
Flora and fauna identification system based on multi-modal data observed
Project/Area Number |
15K12027
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
青野 雅樹 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (00372540)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 深層学習 / 端数型プーリング / 画像特徴量 / ノイズ有訓練データ / 双線形フィルタ / 植物鑑定 |
Outline of Annual Research Achievements |
最終年では、植物鑑定の国際コンテスト(PlantCLEF2017)に参加し、「訓練データにノイズの多い状況下での植物鑑定トラック」で前年に引き続き世界第1位の鑑定精度を達成した。2017年で開催された3トラックの平均では世界第2位であった。2017年の国際コンテストでは、データが10倍にスケールアップし、雑音も含まれたが、我々の開発した技術で、これらの問題を解決し、大きな成果を得ることが出来た。 こういった多様な植物画像(花、葉、樹形、樹皮、実、雑音がまざったもの)で最高の鑑定性能を発揮するには、撮影に使われたメタデータ(GPSや日時、場所情報)だけでなく、深層学習のアークテクチャの刷新が必要と考え、「端数型プーリング手法」を開発した。こちらは、Springer社の国際ジャーナルに投稿し採択された。当初掲げた、3項目に関する3年間のまとめは以下のようである。 【項目1:動植物鑑定無期特徴量抽出とマルチモーダル化】特徴量としては、フィッシャーベクトルのような手作り特徴量と深層学習で得られる各種レイヤ(CNN,MLP層等)の出力から得られる特徴量の混合手法が有効であった。マルチモーダル化は、画像とテキスト情報のほか、日付やGPSの位置情報などの数値データも有効であることがわかった。 【項目2:世界最高レベルの鑑定性能に向けた技術開発】2年目から国際コンテストPlantCLEFに参加し、2016年に世界第1位、2017年も訓練に雑音(ボケた画像、切れた画像、植物以外の画像などに間違ったラベルのついたデータ)のあるタスクで世界第1位を維持、全体では2位と、高性能な技術開発を行った。 【項目3:実用化に向けた技術開発】畳込み型の深層ニューラルネットワークで、正方形以外の画像を可能とする双線形フィルタの開発、端数型のプーリング技術など新規な深層学習のアーキテクチャ開発を行った。
|
Research Products
(21 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Large-Scale 3D Shape Retrieval from ShapeNet Core552017
Author(s)
Manolis Savva, Asako Kanezaki, Takahiko Furuya, Ryutarou Ohbuchi, Masaki Aono, Atsushi Tatsuma, S. Thermos, A. Axenopoulos, G. Th. Papadopoulos, P. Daras, Xiao Deng, Zhouhui Lian, Bo Li, st al.
Organizer
Eurographics Workshop on 3D Object Retrieval
Int'l Joint Research
-
-
-
-
-