1996 Fiscal Year Annual Research Report
文書認識システムの汎用性の向上と全自動化に関する研究
Project/Area Number |
08780324
|
Research Institution | Tohoku University |
Principal Investigator |
後藤 英昭 東北大学, 情報処理教育センター, 助手 (40271879)
|
Keywords | 文書画像解析 / 文字行方向検出 / 文書部ブロック抽出 / 文書認識 |
Research Abstract |
本研究の目的は、複雑なレイアウトの文書も取り扱えるような汎用性の高い文書画像解析処理の実現であった。まず文字行の配置方向を検出する手法について理論的・実験的に検討を行った。文書画像上の黒画素の連結成分に対する外接矩形の配置を局所的に評価し、画像の局所領域における文字行の傾きを検出する手法を開発した。既開発の文字行抽出処理(区分直線連結法)を併用して評価実験を行った結果、一枚の文書上の複数の文字行の方向が一致していない場合でも効率的かつ高精度な文字行の抽出ができることが確認された。本手法は漢字やカナ、アルファベットといった文字の種類に依存しない処理であり、実験により日本語・英語混在文書への適用も可能であることが示された。なお、日本語の文書では縦書きと横書きの文章領域が混在することがあり、文字行の正しい方向を検出する必要がある。文字行中の一部の文字をサンプルとして文字認識処理にかけ、文字の類似度を縦方向と横方向で比較することで、方向検出が可能となった。本処理と先の傾き検出の処理を組み合わせて、文字行の正しい配置方向を検出する系統的な手法を開発した。 次に、複数の文字行の相対位置関係を評価することによって、文字行候補を結合し、文章ブロックを構成する手法を開発した。本手法では、文字行の高さと長さ、行間距離、重なりの割合といった、記述文字(言語)に依存しない局所的なパラメータのみを結合の評価に用いており、文書全体のレイアウトに関する事前知識をほとんど利用していない。その結果、矩形やL字形に限らず、非矩形の文章ブロックも抽出でき、文章領域と図・写真などが入り組むような複雑なレイアウトの文書も取り扱える処理が実現された。
|