研究概要 |
画像認識における基本演算は入力画像情報とデータベース中に格納された情報との照合操作であるとみなすことができるが、この照合操作は、適当な距離尺度の下で与えられたベクトルに最も近い要素をデータベース中のベクトル群の中から探索する問題に帰着できる。画像データをベクトル表現する場合、得られるベクトル通常高次元となる。高次元データの取り扱いには様々な困難が生じるが、その1つに上記のような最近接検索の検索速度の悪化が挙げられる。本研究においては、まず典型的な高次元データ検索方式である単純検索方式(しらみつぶし法,brute force法)、空間の再帰分割に基づく検索(kd木を用いた検索アルゴリズム)を比較し、高次元データ検索における問題点とそれがなぜ生じるのかを明かにする。次いで、高速検索実現のために、ある距離尺度の下で、近い要素を同一スロットに写像するようなハッシュ関数を用いる手法に基づくアルゴリズムを検証し、必ずしも最近接要素が得られる保証は無くなるものの、十分近いデータを高速に検索可能であることを見る。 以上の予備実験から得られる知見に基づいて、クラスタリングおよび次元低減手法に基づく画像検索システムについて述べる。このようなシステムにおいて高速検索性能が実現できるか否かは、各データがクラスタリング可能であり検索毎に適切なクラスを高速に選択できる関数が獲得できるか否かにかかっている。これは従来パターン認識の分野で研究が進められてきている多クラスパターン識別器であるとみなすことができる。このとき、求められる多クラス識別器は、多クラスを高精度かつ高速に識別できるものであると同時に、精度100%は現実には期待できない以上、最も可能性の高いクラスだけではなく複数の可能性の高いクラスを生成できるようなものであることが望ましい。本報告では、SVMを用いた、そのような多クラス識別器の構成手法、特に多重仮説生成手法について述べ、その有効性を文字画像を対象とした実験により示す。
|