Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2001: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2000: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Research Abstract |
本研究では,ビデオカメラで撮影した任意の画像から文字領域を抽出し,認識を行うシステムの作成を目的としている.本年度は特に,抽出対象文字列としてハングルを対象にした研究を中心的に行なった.自然画像からハングルの文字構成の特徴を利用し文字領域を抽出する手法,および,抽出した文字列からハングルを構成する字素を認識する手法について検討を行なった.また,同時に,文字に限定しない領域抽出手法の検討も行なった. 情景画像からのハングル文字領域抽出手法に関する検討では,ハングルの構造特徴を積極的に利用しハングル文字列を抽出する.まず,情景画像から求めた輪郭線から,字素候補を抽出する.その抽出された字素候補に対して,NN(Nearest neighbor)法を改良した手法を適用して,字素候補の絞り込みを行なう.最終的には,ハングルの構成規則を満たす字素候補からハングル文字列を抽出する.実験の結果,491文字のハングルを含む100枚の画像から,約86%にあたる425文字のハングルを抽出できた.さらに,抽出したハングルに対し,細線化を行ない,端点および交点数による字素認識を行なった.細線化においては,Hilditchの細線化手法を改良し,ひげの発生を低減した.100枚の画像に存在するハングルにおいて,字素どうしの接触がない453字素中約72%にあたる326字素が認識できた. また,対象を文字のみに限定せず,任意の対象に対して,物体を一まとまりとして抽出することを目的とした領域分割手法についても検討を行った.画像中の領域の特徴量として,領域境界の輪郭強度,領域の色の統計的な分布などを用いて,隣接領域の統合を行なう領域分割手法について検討を行なった.従来の手法に比べ,視覚的に,物体をあるまとまった領域として抽出することができた.
|