研究課題/領域番号 |
17K20008
|
研究機関 | 九州大学 |
研究代表者 |
松川 徹 九州大学, システム情報科学研究院, 助教 (80747212)
|
研究期間 (年度) |
2017-06-30 – 2021-03-31
|
キーワード | 畳込ニューラルネットワーク / 融合 / CNN特徴転移 / 画像認識 / 深層学習 |
研究実績の概要 |
大規模なデータベースで学習された畳込ニューラルネット(CNN)の中間出力を他タスクへの特徴量として転用するCNN特徴転移は、学習元のタスクと適用タスクの性質が類似する場合に限り特に高い性能を発揮するため,学習データベースの選定が重要となる. 画像認識の認識対象は,複数の意味概念の集まりであるため、高精度な認識を実現するためには,従来のように単一のデータベースのみで学習されたCNN特徴を転用するのみでは不十分である. 本研究では, 複数の大規模データベースで学習されたCNNを融合し, 多様なタスクへ転用可能な汎用的な特徴抽出手法を探求する. 平成30年度は,当初計画していた画像説明文生成タスクにおける特徴融合の探索的実験をMSCOCO データベースで行った. その結果,ImageNetとPlaces データデータベースで学習済みの2つのCNN特徴の融合による精度向上を確認できた. もっとも,このタスクでは説明文生成器の学習に多大な学習時間が必要とされたため,単純な特徴連結を少数の条件でしか試せていない. そのため,小規模な学習データを用いるタスクで特徴抽出手法を開発することにした. まず,小数の学習データを用いるカメラ間の人物照合タスクにおいて,50層の深いCNNから得られる特徴は, より出力層に近い層から抽出した特徴が,人為的に設計した画像特徴と相補的に機能することを明らかにした. この成果を含めた論文は投稿中である. また,前年度考案したCNN特徴マップの判別的集積法を改善可能な方法として,特徴マップから人物姿勢クラスタリングを行うことにより向きに依存した特徴を得る手法を考案し,良好な結果が得られている. さらに,CNN融合方式として双線形プーリングの拡張としての高次相関プーリングとパワー正規化法を考案した. これは画像識別タスクにおいて実験を行う予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
単数のCNN から得られる特徴について開発した手法の有効性を実験により効果を示せているが,複数のCNN特徴について考案した融合方式の実験的検討が,不十分である.
|
今後の研究の推進方策 |
本年度考案した,複数CNNの融合方式であるCNN特徴の高次相関プーリングとパワー正規化の実験を画像識別タスクにおいて評価する. 対象データとして,複数の物体が関連するvisual phrase データなどを考えている. さらに複数CNN 特徴の融合方式を改善する手法を開発する.
|
次年度使用額が生じた理由 |
本年度は海外での研究成果発表に至らなかったため, 旅費に未使用額が生じた. 次年度に大規模な実験を行うためGPUなどの計算資源が必要であり,その分に補填する.
|