研究概要 |
本研究では,ビデオカメラで撮影した任意の画像から文字領域を抽出し,認識を行うシステムの作成を最終目的としている. 本年度の研究では,自然画像から文字領域を抽出する手法,および,抽出した文字列を従来の文字認識アルゴリズムを用いて認識させるための画像高精細化手法について検討を行った. 自然画像からの文字領域抽出手法に関する検討では,空間領域と包空間の両方の特徴から文字領域候補を抽出し,両方の特徴に重複する領域と文字列を構成する条件を満たす領域を抽出することで,文字列領域の抽出を行う手法を提案した.提案手法を20個の文字列を含む5枚の自然画像に適用した結果,8割の文字列領域を抽出することができた.また,抽出した文字列を市販の文字認識ソフトウエアで認識させたところ,70%の認識本であった. また,対象を文字のみに限定せず,任意の対象に対して,物体を一まとまりとして抽出することを目的とした領域分割手法についても検討を行った.画像中の隣接画素の色差に基づいて領域を統合する手法に対して,エッジ抽出手法で得られるエッジ強度を導入し,一塊の物体を一つの領域として抽出する手法を提案した.従来の手法に比べ,視覚的に,物体をあるまとまった領域として抽出することができた. 同時に,自然画像から手作業で切り出した低解像度である文字列画像に対し,カメラ撮影時の非可逆圧縮による雑音の除去,および,周波数領域での画像の拡大手法について提案した.提案手法を適用することで,空間領域での拡大手法に比べ約1.5倍の認識率を得ることができた.
|