研究課題/領域番号 |
12680377
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 信州大学 |
研究代表者 |
丸山 稔 信州大学, 工学部, 助教授 (80283232)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
2,800千円 (直接経費: 2,800千円)
2002年度: 500千円 (直接経費: 500千円)
2001年度: 900千円 (直接経費: 900千円)
2000年度: 1,400千円 (直接経費: 1,400千円)
|
キーワード | データ検索 / ハッシュ法 / 主成分分析 / 混合正規分布モデル / 画像検索 / クラスタリング / SVM / 多重仮説 / クラス識別 / 多クラス問題 / 例題からの学習 / 汎化誤差推定 / 最近接探索 / 手書き文字認識 / 多クラス識別 / DAG / 順位正解率 / 次元圧縮 / EMアルゴリズム / 画像表現 |
研究概要 |
画像認識における基本演算は入力画像情報とデータベース中に格納された情報との照合操作であるとみなすことができるが、この照合操作は、適当な距離尺度の下で与えられたベクトルに最も近い要素をデータベース中のベクトル群の中から探索する問題に帰着できる。画像データをベクトル表現する場合、得られるベクトル通常高次元となる。高次元データの取り扱いには様々な困難が生じるが、その1つに上記のような最近接検索の検索速度の悪化が挙げられる。本研究においては、まず典型的な高次元データ検索方式である単純検索方式(しらみつぶし法,brute force法)、空間の再帰分割に基づく検索(kd木を用いた検索アルゴリズム)を比較し、高次元データ検索における問題点とそれがなぜ生じるのかを明かにする。次いで、高速検索実現のために、ある距離尺度の下で、近い要素を同一スロットに写像するようなハッシュ関数を用いる手法に基づくアルゴリズムを検証し、必ずしも最近接要素が得られる保証は無くなるものの、十分近いデータを高速に検索可能であることを見る。 以上の予備実験から得られる知見に基づいて、クラスタリングおよび次元低減手法に基づく画像検索システムについて述べる。このようなシステムにおいて高速検索性能が実現できるか否かは、各データがクラスタリング可能であり検索毎に適切なクラスを高速に選択できる関数が獲得できるか否かにかかっている。これは従来パターン認識の分野で研究が進められてきている多クラスパターン識別器であるとみなすことができる。このとき、求められる多クラス識別器は、多クラスを高精度かつ高速に識別できるものであると同時に、精度100%は現実には期待できない以上、最も可能性の高いクラスだけではなく複数の可能性の高いクラスを生成できるようなものであることが望ましい。本報告では、SVMを用いた、そのような多クラス識別器の構成手法、特に多重仮説生成手法について述べ、その有効性を文字画像を対象とした実験により示す。
|