研究概要 |
我々の日常の行動において,何気ない情景中から文字情報を見つけ出し,それを理解して利用することが多い.また,文字情報が障害物や遠方で読むことが困難である場合,視点を変えたり,見えるところまで移動して文字情報を取得することもある.本研究では,我々が文字情報を取得する何気ない行動プロセスを,OCRを用いた情景中の文字パターンを認識するシステムに導入することを目的としている.この目的を達成するために,情景中に文字情報が存在するか否かの判定も含め,文字情報が存在するであろうと考えられる位置や領域に対して着目する技術の開発を行っている.具体的には,文字スポッテング(着目)エンジンをパソコンに組み込み,パンチルトカメラで入力された情景画像に対して,文字が存在しうる領域に着目し,その領域付近をパンチルトカメラで画像の再入力を行い,その領域内に含まれる文字パターンに対する認識率を向上させることを目指している.研究の目的に対して,平成21年度は,情景に文字が存在しうるか否かを判定する手法を提案し,情景中で見かけ上遠方に存在するため認識処理を導入できない文字パターンを精度良く着目する文字スポッティングエンジンの開発を目指した.研究成果としては,文字領域がどこに存在するかを確定するために,文字の普遍的特徴を利用し,文字らしさを判定する手法を提案し,その実用性についても明らかにした.この研究結果から文字スポッテングエンジンのプロトタイプを実現するに至った.これと並行して,情景中に存在する文字情報にパンチルトカメラを着目させるための前段階として,パンチルトカメラの制御プログラムを開発した.また,単独の文字だけでなく,重なり合う文字情報についても,各文字単位に分離させる試みを実施した.以上の研究について,5件の口頭発表を実施した.
|