平成29年度は、前年度に引き続きビジュアルビッグデータによる大規模画像検索および画像認識の性能向上を図った。まず、画像検索において、2段階の畳込みニューラルネットワーク(Convolutional Neural Network、CNN)を利用したハッシュ関数学習法による新たな方法論を確立した。これは、予め一段目のCNNにビジュアルビッグデータの特徴を学習しておき、探索に必要なラベル情報に対してハミング距離がクラス内で最小、クラス間で最大となるハッシュ符号を生成し、この符号集合をターゲットとして2段目のCNNを学習させ、より最適なハッシュ探索を行うものである。本手法と従来手法との性能を比較評価するため、公開されているデータセットLFWなどを用いた実験結果、従来手法を超える性能を得ることができた。また、Discriminative Histogram Intersection(DHI)に基づくマッチング距離学習法を確立した。次に画像認識では、2017年9月英国マシンビジョン国際会議(BMVC)のIrregular Domain深層学習ワークショップにおいて、スパースグラフ表現によるグラフニューラルネットワーク(Sparse Graph Neural Network、SGNN)を用いた顔画像認識に関した研究論文を発表した。これは、画像からスパースグラフ表現により疎なグラフを構成し、近年着目されているGNNとの融合を図ったものである。顔画像認識の比較評価実験の結果、SGNNは、そのネットワーク構造が約10層のコンパクトなものにも拘わらず、同じような構造のCNNに比べてより高い認識能力を有することがわかった。また標準顔画像データセットLFWやYouTubeFaceなどを使用した比較評価実験では、超多層のFaceNetとほぼ同等の認識精度を示した。
|