研究課題/領域番号 |
15K00253
|
研究機関 | 山口大学 |
研究代表者 |
韓 先花 山口大学, 創成科学研究科, 准教授 (60469195)
|
研究分担者 |
陳 延偉 立命館大学, 情報理工学部, 教授 (60236841)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 高レベル画像表現 / 人間認知理論 / K-Supportプーリング法 / Stacked Fisher Network / CNN |
研究実績の概要 |
高信頼性且つ深層の画像表現を実現し、HEp-2細胞のパターン認識を行った。研究業績は以下の三点がある。 1.画像から局所特徴の抽出において、従来でよく用いられたSIFTやSURFではなく、注目画素を中心になる局所パッチをそのまま使うことですべての情報を保持できるマイクロテクストンを提案した。また、人間認知理論に基づく周りの画素において注目画素の刺激強度を求め、ロー画像ドメインから人間認知強度ドメインへ変換法及びWLD (Weber Local Descriptor)局所特徴抽出法を提案した。更に、Fisher Network を用いてWLDをコーディングすることで、高次な画像表現統計量を抽出した。 2.1で提案したFisher Networkに基いて、深層フレームワークを拡張した。Fisher Networkで得られた局所記述子のコーディングベクトルに対し、領域ベースプーリングすることで、中層(Middle-level)の画像表現マッパを求める。更に、中層画像表現マッパにをもう一度データ駆動モデルを用いてコーディングし、グローバルやピラミッド空間でのプーリングによって高レベルな画像表現法を開発した。 3.K-Support空間プーリングを用いたCNNを開発した。一般CNNネットワークにおいて入力画像サイズを統一する必要がある。本研究では任意サイズの入力画像に対応できるK-Support空間プーリングに基づくCNNを提案した。畳み込み層の後に同じ数の領域を分け空間的プーリングを行うことでにお同じサイズの特徴マップを求める。また、従来のMaxやAverageプーリングではなく、新たなK-Supportプーリング法を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度では、人間認知理論に基づいく局所記述子(WLD)抽出を提案し、画像表現するためFisher networkを用いた高次な統計量を求めた。また、Fisher networkを積み重ねことで深層フレームワークを提案し、高レベルの画像表現を抽出した。提案した手法は顕微鏡細胞画像認識への応用を行い、その有効性を検証した。 更に、近年盛んに用いられる畳み込みネットワーク(CNN)では入力画像サイズを統一する必要があるため、本研究は任意サイズの入力画像に対応できるK-Support空間プーリングに基づくCNNを提案した。同時に、従来のMaxやAverageプーリングの代わりに、K--Supportプーリング法を提案し、顕微鏡細胞画像やリモートセンシング画像認識への応用において有効性を検証した。
|
今後の研究の推進方策 |
本年度では、人間認知理論に基づく高信頼性の局所特徴抽出法及び高レベルな画像表現を学習できるStacked Fisher Networkを提案した。また、任意サイズの画像に対応できるK-Support空間プーリングに基づくCNNを開発し、顕微鏡細胞画像やリモートセンシング画像認識への基本検証を行った。これから、提案した画像表現の構造と認識プロセス(分類器)を連動させ、学習したデータ駆動モデルの初期パラメータをfine-tuningする。また、実験用データベースの構築と実用システムの開発を行う。 1.駆動モデルの初期パラメータのfine-tuning。 2.実験用データベースの構築:アルゴリズムの性能評価を行うために、実用画像および映像データベースを構築する。 3.デモプログラムの作成:構築したデータベースをもとに、デモプログラムを作成し、ユーザへのヒアリングを行い、認識コンテンツ数を拡張する。また、実用システムの構築を行う。
|
次年度使用額が生じた理由 |
人件費と国際学会への参加費用は他の研究予算で実行したため、30万程度の未使用額を生じた。
|
次年度使用額の使用計画 |
データベース収集に関わる人件費、大規模データを保存する大容量ストレージ及び研究成果を発信するため国際学会の参加などが必要であり、そのための費用として使用する予定である。
|