1996 年度実績報告書

構造情報に基づく新しい文字認識方式に研究

研究課題

研究課題/領域番号	07458071
研究種目	基盤研究(B)
研究機関	北陸先端科学技術大学院大学
研究代表者	木村正行北陸先端科学技術大学院大学, 情報科学研究科, 教授 (50006219)
研究分担者	大町真一郎東北大学, 工学研究科, 助手 (30250856)
キーワード	文字認識 / 印刷文字 / 大分類 / 文字画像ヒストグラム / 構造情報 / 高速高精度
研究概要	日本語で使用される文字は、様々な字体を考慮すると、JIS第一水準のみでも標準パターンの総数はゆうに1万字を超える。そこで、認識の対象とする文字全体を文字の構造情報を用いて、先ず数百字程度の大きさのクラスに分類し、ついで分類された各クラスの特性に適した標準パターンの作成と中分類・細分類することにより、確認速度及び精度を飛躍的に進展させるという方針のもとに研究を進めた。 (1)文字画像のヒストグラムを利用したノイズに強い構造情報として、縦または横の顕著な線分を持たず斜めの線分が主体となる文字の分類ができた。これにより全字種を4個のクラスの分類することが可能となった。 (2)文字画像の潰れは、縦及び横方向のヒストグラムの谷を埋めることに着目しいて、大部分が潰れの顕著な文字からなるクラスとその他のクラスに分類することを可能にした。これにより潰れも文字に重点を置いた認識手法を有効に活用することができるようになった。 (3)縦及び横方向のヒストグラムの横軸を2等分して得られる4個の領域のそれぞれにおけるヒストグラムのピークの有無により、全字種を16個のクラス分類する実験を行い、その有用性についての見透視を得た。これにより、全字種を数百程度の大きさのクラスに分類することが、より現実的なものとなってきた。以上が平成8年度の研究実績の概要である。平成9年度はこれを基にして,飛躍的高速高精度のプロトタイプを実現する予定である。

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] 木村正行: "構造情報に基づく漢字印刷文字認識" 電子情報通信学会信学技報. PRMU96-85. 37-44 (1996)
[文献書誌] 大町真一郎: "カテゴリー間分布を考慮した文字認識用マルチテンプレート辞書の構成法" 電子情報通信学会論文誌(D-II). J79-D-II,9. 1525-1533 (1996)
[文献書誌] 大町真一郎: "つぶれを考慮した低品質印刷文字の高精度認識" 電子情報通信学会論文誌(D-II). J79 D-II,9. 1534-1542 (1996)