2012 Fiscal Year Research-status Report
多次元多様体学習を用いたコア情報の抽出と階層的大規模画像理解の研究開発
Project/Area Number |
24700179
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Ritsumeikan University |
Principal Investigator |
韓 先花 立命館大学, 立命館グローバル・イノベーション研究機構, ポストドクトラルフェロー (60469195)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 国際情報交換 |
Research Abstract |
本年度では、画像から局所的な特徴を抽出し、一つのテンソルとして取り扱い、統一的に効率よく記述を行った。更にテンソルベース統計分析手法を開発し、認識に有用なコア情報を抽出した。 A. 映像や画像から抽出された様々な情報を効率的に融合できる方法を開発した。画像情報認識理解技術の中で、画像の特徴抽出が最も重要な技術の一つである。近年では、一枚の画像から抽出した大量の局所的なSIFT特徴を量子化し、予め用意したVisual-Wordsのヒストグラムとして表現するBag of Features (BOF)が提案された。しかし、BOFで局所的なSIFT特徴は予めに用意したVisual-Wordsを用いて近似されるため、識別に有効的な情報を失う可能性がある。また、近似によって一枚の画像から抽出した局所SIFT特徴やVisual-Wordsが大量に必要であり、計算コストがかかるという問題点がある。そこで、本研究では画像から抽出した局所的なSIFT特徴を量子化では無く、一つのテンソルとして取り扱い、統一的に効率よく記述した。 B. 多次元多様体学習法を開発し、認識に有用なコア情報の抽出を行った。本研究で多次元多様体学習(MSNE)を開発し、有効な特徴量の抽出を行った。Aで抽出した複数の局所的な情報を開発した多次元多様体学習を用いて効率的に融合ができた。従来の手法とくらべてメディアコンテンツの認識率を向上するだけではなく、計算コストやメモリ使用量も削減させることを検証した。本シーズでは、基本的なフレームワークを実現することを目的としており、大規模画像データセットの理解・認識への実応用を目標とする。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度、主に二つの研究目的があって、まず映像や画像から抽出された様々な情報を効率的に融合できる方法を開発する。そのため、われわれは画像から抽出した大量の局所特徴を一つのテンソルとして取り扱う、特徴の効率的な融合を実現した。また、従来の局所特徴のコーディング法を改善し、グループスパースコーディング法を開発した。研究成果はトップレベルの国際学会誌や国際学会で発表した。そして、二番目の目的としては認識に有用なコア情報の抽出である。そして、本研究で多次元多様体学習(MSNE)を開発し、テンソルとして扱ったさまざまな特徴からコンパクト且つ判別的コア情報の抽出を実現した。
|
Strategy for Future Research Activity |
本年度では、階層的なボトムアップとトップダウン処理を融合する画像理解手法を開発し、画像理解精度の向上を目指す。画像認識・理解を三層構造でする(下位層はビジュアル特徴で、中間層はそれぞれでオブジェクト(コンセプト)で、上位層はセマンティック意味である)。 A. 各層間の相補関係を利用した画像理解精度の向上:各層間でトップダウン、ならびに、ボトムアップの処理を行うことで、状況によって決まってくる前提を解釈したり、推論を補ったりすることで、総合的なバイアスや錯誤を減少させる。更に、画像の全体セマンティック意味の理解による、局所オブジェクト認識の修正も可能になる。 B. オブジェクト間の相関関係を利用したオブジェクト認識精度の向上:オブジェクト間の相関関係にも注目し、その相関関係を利用してビジュアル特徴のみで推定できないオブジェクトの認識を行う。具体的に、WordNetやトレーニングデータを利用し、局所的コンセプト(オブジェクト)認識と全体のセマンティック意味理解との相補関係の究明を行う。WordNetには言葉(word)・ 同義語集合(synset)・説明文(gloss)などがあり、ある同義語集合は他の同義語集合と上位関係(hypernym)・下位関係(hyponym)・全体関係(holonym)・反意関係(antonym)で関係付けられている。そこに記述した関係を使い、定義されたobjectをwordとして扱い、それらのwordに関連する同義語集合ネットワークを作って、状況により拡張する。更に、画像理解の一段階として、画像が含む意味を幾つかのオブジェクトとして認識する必要がある。ただし、画像の意味のあいまいさと人間のそれに対する解釈の多義さがあるために、あらかじめ認識対象になる各オブジェクトの定義と各オブジェクト間の関連性を考慮しなければならない。
|
Expenditure Plans for the Next FY Research Funding |
初年度の研究は主に理論手法の開発で、代表者は自身で作業を行ったため、人件費の執行が発生しなくなって、15,758円の未使用額を生じた。次年度の研究費の使用計画は以下のとおりです。 研究を順調に進めるため、世界の最新トレード、他の研究者の交流及び研究成果の発信が不可欠である。それに生じした旅費を計上する。 研究を遂行する際、大規模データベースを保存するための大容量ストレージの購入とデータ収集に当たる発生する人件費を計画してある。 研究に関する資料印刷等の消耗品も必要である。
|
Research Products
(9 results)