2017 Fiscal Year Annual Research Report
Study on Fast Image Retrieval and Recognition Using Visual Big Data
Project/Area Number |
15K00248
|
Research Institution | Waseda University |
Principal Investigator |
鎌田 清一郎 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (00204602)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 画像認識 / 画像検索 / 深層学習 / ハッシュ関数 / スパースグラフ / グラフニューラルネットワーク / 畳込みニューラルネットワーク |
Outline of Annual Research Achievements |
平成29年度は、前年度に引き続きビジュアルビッグデータによる大規模画像検索および画像認識の性能向上を図った。まず、画像検索において、2段階の畳込みニューラルネットワーク(Convolutional Neural Network、CNN)を利用したハッシュ関数学習法による新たな方法論を確立した。これは、予め一段目のCNNにビジュアルビッグデータの特徴を学習しておき、探索に必要なラベル情報に対してハミング距離がクラス内で最小、クラス間で最大となるハッシュ符号を生成し、この符号集合をターゲットとして2段目のCNNを学習させ、より最適なハッシュ探索を行うものである。本手法と従来手法との性能を比較評価するため、公開されているデータセットLFWなどを用いた実験結果、従来手法を超える性能を得ることができた。また、Discriminative Histogram Intersection(DHI)に基づくマッチング距離学習法を確立した。次に画像認識では、2017年9月英国マシンビジョン国際会議(BMVC)のIrregular Domain深層学習ワークショップにおいて、スパースグラフ表現によるグラフニューラルネットワーク(Sparse Graph Neural Network、SGNN)を用いた顔画像認識に関した研究論文を発表した。これは、画像からスパースグラフ表現により疎なグラフを構成し、近年着目されているGNNとの融合を図ったものである。顔画像認識の比較評価実験の結果、SGNNは、そのネットワーク構造が約10層のコンパクトなものにも拘わらず、同じような構造のCNNに比べてより高い認識能力を有することがわかった。また標準顔画像データセットLFWやYouTubeFaceなどを使用した比較評価実験では、超多層のFaceNetとほぼ同等の認識精度を示した。
|