研究課題/領域番号 |
61460231
|
研究機関 | 東北大学 |
研究代表者 |
木村 正行 東北大, 工学部, 教授 (50006219)
|
研究分担者 |
安倍 正人 東北大学, 工学部, 助手 (00159443)
菰田 保夫 東北大学, 工学部, 助手 (30108469)
江島 俊朗 長岡技術科学大学, 助教授 (00124553)
|
キーワード | 活字認識 / 手書き文字認識 / 漢字認識 / 文字連接情報 / 文字自動切出 / 単語辞書 |
研究概要 |
手書き及び活字の漢字を主体として、書式に依存しない文字認識システムについて研究した。本研究は昭和59年度及び60年度にわたって開発された「セル構造回路網に基づく手書き文字認識システム」を活用して行われたもので、その概要は次の通りである。 (1)文字の自動切出 紙面から文字を高速かつ精度よく切り出す方法について研究し、その基本部分を完成した。しかし、精度を上げるためには、認識部分で得られる情報を用いて修正することが必要であり、単語辞書による知識の活用を併せて次年度の検討課題のひとつになっている。 (2)活字認識 活字認識は手書文字に比して変形の度合いが著しく小さいので、高速認識が可能となる。このような観点から、偏、榜、構えなどの構造情報を積極的に活用する高速連想照合システムの構成と認識アルゴリズムを開発し、その有用性を実証するための認識実験を精力的に進めている。 (3)手書き漢字認識 1)手書き文字の場合、一字種に対して標準パターンを複数個用意すことが不可欠であり、試作した文字認識システムを用いて膨大な認識実験を行い、最適複数化の指針となる有用な知見を得た。2)文字認識用単語辞書を作成し、単語における文字間の連接情報を用いてパターンマッチングによる認識結果を修正するアルゴリズムを開発し、認識実験を行った。その結果、認識精度を一段と向上できる見透しを得た。 文字切り出し、認識、単語辞書による修正(後処理)を有機的に統合して全体としての認識精度を挙げることが今後の大きな課題である。
|