本研究は、膨大な学術雑誌や書籍の内容を電子化することを目的として、高解像度カメラで取得した文書画像の情報処理システムの構築を目指した。特に、任意に回転した文書にも対応でき、手軽な入力作業を可能にする。このシステムは大量情報の整理・検索への使用を目的とする。一般にレイアウト解析により文字行を抽出することが可能であるが、文字の向きまではわからない。そのため文字の向きが推定できる認識法と、これまでに開発されたレイアウト解析法を利用した簡易な文書電子化システムを研究開発する。具体的には、電子化されてない大量の古い年代の論文誌を半自動入力するためにページめくり器を用いて、冊子を裁断することなく見開きページ画像をカメラから入力し、レイアウト解析、文字認識を適用することによりデータベースを構築する簡易なシステムを構成した。また、1文字毎の向きを推定することが可能で複数フォント対応の日本語約3000カテゴリに対応可能な文字認識方式を開発した。
|