本研究の目的は異種情報を統合する情報表現手法を確立し、それを画像検索結果の言語による修正などに応用することである。本研究では主として画像とそれを記述したテキストに関する情報統合を対象とした。まず、DBMを用いた情報統合を行い、情報統合層を特徴に用いることにより、CNNによる特徴抽出よりも画像識別精度を向上できることを示した。またLSTMとCNNによる統合モデルを用いた場合の画像検索結果のテキストによる修正のための類似度尺度を考案し、その有効性を示した。これらの処理の効率化のためにはCNNの処理時間の短縮が必要になる。そこで、CNNの圧縮方法を考案し、手法の有効性を示した。
|