Budget Amount *help |
¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 2000: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 1999: ¥800,000 (Direct Cost: ¥800,000)
|
Research Abstract |
紙などに印刷された文書情報を機械可読とするには,いくつか段階を経るが大きく分けて文書情報を画像データとして得る段階とそれを認識する段階とがあり,両者の連携がなく,人手のパラメータ調整が行なわれており,さらに紙面の読み取り装置への設置も煩雑である.本研究ではこれらの文字認識処理を統合する.工学的に用いる画像は一般に画像全体で均一解像度であるが,本研究では中心窩視覚と呼ばれる視線の中心部において高解像度となり,周辺になるにつれてその解像度が低下するような不均一な構造を持つ視覚を,文書情報の獲得処理へ適用し効率的なシステムの構築を行なうことを目指した.中心窩視覚の実現にはLog Polar Mapping(LPM)を採用し,文字認識処理の実現とカメラの回転により画像情報をアクティブに獲得できる装置を製作した.文字認識では,日本語約1万4千字を対象にテンプレートマッチング実験を行なった.画像の多重解像度性を考慮して文字毎に数種の解像度画像を生成し,それぞれのマッチングを行なった.これによりある程度,段階的な文字種のカテゴリ分類と,中心窩画像の特徴である中心重視のマッチングが行なわれることが確認された.市販の文字認識ソフトにおいて高認識率となる文字の解像度値も検証により得ており,これらも参考にしたマッチング実験とした.実機製作では単眼視でパンとティルト方向に回転できるシステムとした.高解像度でのビデオ画像が得られるカメラを選定し,パーソナルコンピュータ上へ取り込み処理した.カメラの回転角に対しどの程度の歪みが画像に生じるのかを実際と計算値とで比較し,得られたカメラ画像から紙面を再構成する処理を実現した.なお,初年度の視点移動シミュレーションでは対象を黒丸としており,文字の場合(線画)との違いが明らかになったため実装しなかった.実機システムへの視点移動と文字認識処理の組み込みは今後の課題である.
|