研究課題/領域番号 |
11305024
|
研究機関 | 東京大学 |
研究代表者 |
柴田 直 東京大学, 大学院・新領域創成科学研究科, 教授 (00187402)
|
研究分担者 |
三田 吉郎 東京大学, 大規模集積システム設計教育研究センター, 助手 (40323472)
|
キーワード | 画像認識 / 手書き文字認識 / 集積回路 / 医用X線写真解析 / VLSI / CMOS / Generarized Lloidアルゴリズム / 特徴ベクトル |
研究概要 |
本研究の目的は、捕らえた画像から絵の要素(これを"ピクレット"と名付けた)を多重解像度で抽出しベクトル化するという独自のアルゴリズムと、これを高速に実行する集積回路の開発により"実時間の画像認識"を実現することである。 平成12年度は、ピクレット抽出器の集積回路ハードウェア化を本格的に進展させるとともに、認識アルゴリズムをさらにロバストなものとするための研究を行った。まずハードウェア化に関しては、前年度設計・試作したチップを詳細に測定評価し、回路的な問題点を洗い出した。特に、テンプレートパターンと入力パターンの相関を取るマッチング回路、最大相関ベクトルを見つける高速サーチ回路について、シミュレーション等を用いて最適化するとともにLSIの試作を行い、所望の特性が達成できることを実証した。画像からピクレットを抽出し、これより64次元の特徴ベクトルを生成する処理は非常に時間のかかる処理であるが、この処理に特化したLSIチップも、新たな機能を追加して設計試作した。これは、多重解像度を2のべき乗で自在に制御でき、且つ画像の任意の部位よりベクトル抽出できるという高度な機能を持っている。これを0.35μmCMOSプロセスで試作を行い、ワークステーション上では、数分という時間のかかる処理が、0.1ミリ秒以下でできることを実証した。一方アルゴリズムに関しても、顕著な進展が得られた。基本パターンの抽出に関し、Generarized Lloidアルゴリズムを用いたベクトル表現法により、非常にロバストな画像認識のできることを示した。手書き数字の認識においては、rejectを入れることで99%の正答率が得られた。歯科医師のセファロX線画像の特徴点抽出についても、学習サンプル数を100例以上に増やしテストを行った結果、大学病院で10年以上の経験をもつ歯科医とほぼ同等の認識結果が得られた。 これらの成果により、全体システム構築に関し重用な知見が得られ、最終年度の研究推進に関し、明確な指針を得ることができた。
|