研究課題/領域番号 |
23500173
|
研究機関 | 信州大学 |
研究代表者 |
丸山 稔 信州大学, 工学部, 教授 (80283232)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | パターン認識 / 機械学習 / カテゴリ認識 / 確率モデル / 特徴抽出 |
研究概要 |
本研究の目的は、事前に学習したあったカテゴリ識別系を木構造を用いて構造化して利用することにより、新規カテゴリの識別を効率化、高度化するための手法を確立することである。新規カテゴリに関しては、この木構造から得られる認識系の線形結合による認識することを想定している。また、新規カテゴリの認識に当たっては、既存の系で利用していた特徴表現をより向上させて認識率等を向上させることが望ましい。平成23年度の研究においては、主として線形結合系の採用による識別能力向上の可能性、既存特徴表現モデルの改善の可能性について、画像カテゴリ認識、文書画像セグメンテーションを対象として検討を行った。いずれの対象についてもBoW(Bag of Words)型の特徴表現に基づく識別を行い、線形結合モデルについては、SIFT, HOGG, Spatial Pyramid Kernelなどの種々の特徴に基づくSVMを学習し、これを適宜組み合わせることによる能力向上の検討を行い、複数種類の線形結合による識別能力向上が可能であることを確認した。文書画像セグメンテーションに関しては、確率的トピックモデル(pLSAモデル)に基づく表現モデルを採用し、粗いセグメンテーションを実現する既存識別系の主力結果を利用して、より詳細なセグメンテーションができるように領域分割の細分化を図る手法を試み、若干の能力向上を確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は既存の認識系を利用して、独立に学習するよりも学習コスト、認識率等の面で優れた新規カテゴリの認識系を構築する手法を確立することである。既存系の利用方法としては、現在のところ、線形結合モデルを想定しているが、この想定が妥当であるかを検証することは今後の研究を遂行する上で重要である。平成23年度の研究においては、Caltec256データの一部を対象とした画像カテゴリ認識系の研究を行い、複数種類の識別系の線形結合モデルにより、識別系の能力向上が図れることが確認されており、今後の研究においてはこの事実を基礎として手法の改善を図ることができると考えられる。
|
今後の研究の推進方策 |
今後の研究においては、平成23年度に実施した画像認識、文書認識を中心とした例題を用いた基本検討に基づいて、同様の対象について、より大規模なデータを対象として、既存識別系の構造化・再利用手法の確立を図る。また、データの大規模化に伴って、手法の高速化の必要性が発生するが、これに関しての検討にも着手する。
|
次年度の研究費の使用計画 |
平成23年度の研究において新規に購入する予定であった数学ソフトウエアのいくつかが、アップグレードキャンペーンを利用して既存ソフトのバージョンアップで入手できたため、次年度使用額が生じた。また、GPUを用いた高速化手法の研究に当初高機能GPUを購入して着手する予定であったが、既存GPUを用いて基礎検討は可能であったため、GPUの新規購入は次年度の計算機環境整備時に行うことにしたため、次年度使用額が生じた。平成24年度の研究においては、平成23年度の研究結果に基づき、より大規模なデータを用いた認識実験等を実施する。このために、より高機能のCPU,大容量のメモリ,高機能GPUを搭載した計算機を購入してプログラム開発を実施する。また、研究成果の公表(学会発表等)のために研究費を使用する予定である。
|