研究課題/領域番号 |
24700179
|
研究機関 | 立命館大学 |
研究代表者 |
韓 先花 立命館大学, 立命館グローバル・イノベーション研究機構, 准教授 (60469195)
|
キーワード | 国際情報交換 |
研究概要 |
本年度では,画像からhand-craftな局所特徴(SIFT,SURF)を抽出しだけではなく,簡単且つ効率に得られるraw特徴(色輝度値,勾配,方向,マイクローストラクチャ等)に対して,データ駆動モデル(K-means,GMM,Sparse coding)を用いて解析し,より高速且つ効率的な画像記述をを行った.また,データ駆動モデル基づく,局所やraw特徴の低次統計量(分布情報)だけではなく,高次統計量(モデルのパラメータに対しての偏移統計量)を計算し,より高次な画像表現を得られた.更に階層的なボトムアップとトップダウン処理を融合する画像理解手法を開発し,画像理解精度の向上を進んでる.画像認識・理解を三層構造でし,認識精度の向上を試した. A.映像や画像から抽出された様々な情報に対して,データ駆動モデルを用いて解析し,効率的に融合できる方法を開発した.画像情報認識理解技術の中で,画像の特徴抽出が最も重要な技術の一つである.近年では,一枚の画像から抽出した大量のhand-craft局所特徴を量子化し,分布情報として表現するBag of Features (BOF)が提案された.しかし,hand-craft特徴の抽出には時間がかかるという問題点だけではなく,次元削減するため一部の情報量を失ってしまう.本研究では,簡単に入手できる画像のraw特徴を直接に使い,データ駆動モデルで解析し,一般化BOFモデルを提案した. B.従来のBOFモデルでは,局所特徴の低次統計量だけを用いた画像表現する.本研究では,低次統計量に加え,モデルのパラメータに対しての偏移統計量(高次統計量)を用いることで,幾つかの画像理解システムに対してより高い精度な認識率を得ることができた. C.画像認識・理解を三層構造でし,各層間の相補関係やオブジェクト間の相関関係を利用した画像理解精度の向上を試した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の主な研究目的では,映像や画像を効率的に表現および画像理解精度の向上である.そのため,われわれは画像から抽出したhand-craftな局所特徴だけではなく,簡単且つ効率に得られるraw特徴(色輝度値,勾配,方向,マイクローストラクチャ等)に対して,データ駆動モデル(K-means, GMM, Sparse coding)を用いて解析し,より高速且つ効率的な画像記述をを行った.また,画像を効率的に表現するため,局所やraw特徴の低次統計量(分布情報)だけではなく,高次統計量を纏めた.更に,画像認識・理解を三層構造でし,各層間の相補関係やオブジェクト間の相関関係を利用した画像理解精度の向上を実現した.
|
今後の研究の推進方策 |
本年度では,近年盛んに研究されたBOFモデルを改善し,局所やRaw特徴のコディング,局所な空間でのプーリングするフレームワークを階層的(deep)に積み上げることで深層BOFを開発し,より高次な画像表現手法を目指す.また,実験用データベースの構築と実用システムの開発を行う. A. 深層BOFを開発し,より高次な画像表現手法を目指す. B. 認識するコンテンツの種類とその定義に関する検討.認識すべきコンテンツについて,ImageNetやLSCOM Lexiconを参考して,さらに,ユーザへのヒアリングや頻繁に検索されるのを加えて,1000個以上のコンテンツを定義する. C. 実験用データベースの構築:アルゴリズムの性能評価を行うために,上記で定義したベースとなるコンテンツの画像および映像データベースを構築する. D. デモプログラムの作成:構築したデータベースをもとに,デモプログラムを作成し、ユーザへのヒアリングを行い,認識コンテンツ数を拡張する.実用システムの構築を行う.
|
次年度の研究費の使用計画 |
研究費の執行はほぼ予定通りに行うことができたが,効率的に行った結果,数万程度が未使用額として発生した. 研究に関する資料印刷等の消耗品も必要である.
|