研究課題
最終年では、植物鑑定の国際コンテスト(PlantCLEF2017)に参加し、「訓練データにノイズの多い状況下での植物鑑定トラック」で前年に引き続き世界第1位の鑑定精度を達成した。2017年で開催された3トラックの平均では世界第2位であった。2017年の国際コンテストでは、データが10倍にスケールアップし、雑音も含まれたが、我々の開発した技術で、これらの問題を解決し、大きな成果を得ることが出来た。こういった多様な植物画像(花、葉、樹形、樹皮、実、雑音がまざったもの)で最高の鑑定性能を発揮するには、撮影に使われたメタデータ(GPSや日時、場所情報)だけでなく、深層学習のアークテクチャの刷新が必要と考え、「端数型プーリング手法」を開発した。こちらは、Springer社の国際ジャーナルに投稿し採択された。当初掲げた、3項目に関する3年間のまとめは以下のようである。【項目1:動植物鑑定無期特徴量抽出とマルチモーダル化】特徴量としては、フィッシャーベクトルのような手作り特徴量と深層学習で得られる各種レイヤ(CNN,MLP層等)の出力から得られる特徴量の混合手法が有効であった。マルチモーダル化は、画像とテキスト情報のほか、日付やGPSの位置情報などの数値データも有効であることがわかった。【項目2:世界最高レベルの鑑定性能に向けた技術開発】2年目から国際コンテストPlantCLEFに参加し、2016年に世界第1位、2017年も訓練に雑音(ボケた画像、切れた画像、植物以外の画像などに間違ったラベルのついたデータ)のあるタスクで世界第1位を維持、全体では2位と、高性能な技術開発を行った。【項目3:実用化に向けた技術開発】畳込み型の深層ニューラルネットワークで、正方形以外の画像を可能とする双線形フィルタの開発、端数型のプーリング技術など新規な深層学習のアーキテクチャ開発を行った。
すべて 2018 2017
すべて 雑誌論文 (4件) (うち国際共著 2件、 査読あり 4件、 オープンアクセス 1件) 学会発表 (15件) (うち国際学会 8件) 産業財産権 (2件)
Multimedia Tools and Applications
巻: 76 ページ: 22059,22076
http://dx.doi.org/10.1007/s11042-017-4801-z
情報処理学会論文誌
巻: 10 ページ: 1,7
IEICE Transactions on Information and Systems
巻: E-100-D ページ: 793,806
http://dx.doi.org/10.1587/transinf.2016DAP0032
巻: 76 ページ: 22095,22117
http://dx.doi.org/10.1007/s11042-017-4840-5