2015 Fiscal Year Research-status Report
Project/Area Number |
15K00253
|
Research Institution | Ritsumeikan University |
Principal Investigator |
韓 先花 立命館大学, 立命館グローバル・イノベーション研究機構, 准教授 (60469195)
|
Co-Investigator(Kenkyū-buntansha) |
陳 延偉 立命館大学, 情報理工学部, 教授 (60236841)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 国際情報交換 |
Outline of Annual Research Achievements |
高信頼性且つ高次な画像表現フレームワークを実現した。研究業績は以下の三点がある。 1.観測されたロー画像から高信頼性且つコンパクトな局所テクスチャ抽出法を提案した。画像からコンパクトなテクスチャ特徴を抽出するため、よく用いられた手法では局所パッチの量子化によって有限な代表記述子を抽出し、その統計量(出現頻度と空間的関連構造)で画像を表現する。しかし、こちらの手法は主に局所パッチの二値量子化を行い、情報の損失だけではなく、ノイズに非常に敏感である。本年度では、注目画素の刺激強度ベースに一定の許容度を設け、周り画素の刺激状態に応じて三値量子化法を提案した。また、感覚に関する精神物理学の基本法則としてよく知られているウェーバーの法則によって、刺激の弁別閾は、基準となる基礎刺激の強度に比例する。同様に画像中にある局所パッチを注目する際、中心画素を基準として周り画素の刺激状態はこの基準になる刺激強度に依存する。そして、提案法はある刺激と基準になるものと絶対差異だけではなく、基準刺激自身の強度も考慮することで、各画素に適した三値化の閾値を自動的に決められ、人間認知理論に基づいた局所記述子のコーディング法を提案した。 2.高次構造統計量の提案:従来法では1で提案した局所記述子に対して画像全体に渡って出現頻度を纏め、画像表現・認識する。しかし、単純に局所記述子の出現頻度で、記述子ペア間の空間的な構造情報をすべて失ってしまうという問題点がある。そこで、本年度では局所記述子の頻度を求めるだけではなく、隣接する記述子ペアがどのように繋がっているかという構造情報を考慮しながら、この記述子ペアは撮影視点に依存するかどうかを解析し、外部環境によりロバストな高次構造統計量抽出法を提案した。 3.局所パッチをコーディングするではなく、全ての情報を保持したマイクロテクストンを局所記述法を提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度では、高信頼性且つコンパクトな局所パターンを記述し、高次構造統計量の開発を目的とする。そのため、我々は画像から得られた局所パッチに対して従来によく使われた二値化するではなく、近似誤差を削減できる三値化することで高信頼性なコーディング法を提案した。 また、人間認知理論に基づいた各画素に適した三値化の閾値を自動的決めることで、より顕著な局所パターンの抽出を行い、高精度な画像認識ができた。更に、単純に局所記述子の出現頻度を抽出するだけではなく、、隣接する記述子ペアがどのように繋がっているかという構造情報を考慮しながら、この記述子ペアは撮影視点に依存するかどうかを解析し、外部環境によりロバストな高次構造統計量抽出法を提案した。
|
Strategy for Future Research Activity |
本年度では、人間視覚認知プロセスに従って、ロー画像に視覚応答強度ドメインを変換し、全ての情報を保持したマイクロテクストンを局所記述子とする。また、混交ガウスモデルを用い、トレーニング記述子集合をフィッチングできるパラメータを学習し、テスト画像の記述子はそのモデルパラメータに対しての偏移統計量(低次と高次)を抽出することで、高信頼性な画像表現(中層:Middle-level表現)を得られる。更に、その提案構造を積み重ねることで、深層フレームワークを発展させ、高信頼性且つ高レベルビジョンの画像表現を学習する。 1.記述子群の高次統計量の抽出:このベースになるのは我々の先行研究として開発したロー画像ドメインから得られたテクストン記述子に対して、高信頼性な高次統計量を抽出することで、異なる種類でも微小な差異しか観測できない顕微鏡細胞画像に対して、熟練技師や医者の主観的な判断と同程度の認識率を得た。また2012年や2013年に開催された国際的なコンテストのトップランクの手法と比べて認識精度を大幅に向上させた。そこで、本研究では、視覚応答強度ドメインの記述子の高次統計量を学習し、より高信頼性な画像表現を得ることで様々な分野のデータセットの理解・認識への実応用を目標とする。 2.深層フレームワークの拡張:前述の提案手法を用いた得られた局所記述子のコーデッドベクトルに対し、領域ベースプーリングする。これにより画像領域から得られた中層(Middle-level)の画像表現をもう一度データ駆動モデルを用いてコーディングし、グローバルやピラミッド空間でのプーリングによって高レベルな画像表現を学習する。
|
Causes of Carryover |
人件費や一部の物品費は他の研究予算で実行したため、30万程度の未使用額を生じた。
|
Expenditure Plan for Carryover Budget |
大規模なデータ処理および高度な計算手法を実行するため、高性能なコンピューターが必要である。
|