本研究は、膨大な学術雑誌や書籍の内容を電子化することを目的として、高解像度カメラで取得した文書画像の情報処理システムの構築を目指した。特に、文書の置き方に制限を設けない手軽な入力作業を可能にする。本研究では、具体的には、電子化されてない大量の古い年代の論文誌を半自動入力するためにページ捲り器を用いて、冊子を裁断することなく見開きページ画像をカメラから入力し、レイアウト解析、角度推定が可能な文字認識を適用することによりデータベースを構築する簡易なシステムを構成した。また、1文字毎の向きを推定することが可能で複数フォントの日本語約3000カテゴリに対応可能な文字認識方式を開発した。
|