1996 Fiscal Year Annual Research Report
Project/Area Number |
07458071
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
木村 正行 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (50006219)
|
Co-Investigator(Kenkyū-buntansha) |
大町 真一郎 東北大学, 工学研究科, 助手 (30250856)
|
Keywords | 文字認識 / 印刷文字 / 大分類 / 文字画像ヒストグラム / 構造情報 / 高速高精度 |
Research Abstract |
日本語で使用される文字は、様々な字体を考慮すると、JIS第一水準のみでも標準パターンの総数はゆうに1万字を超える。そこで、認識の対象とする文字全体を文字の構造情報を用いて、先ず数百字程度の大きさのクラスに分類し、ついで分類された各クラスの特性に適した標準パターンの作成と中分類・細分類することにより、確認速度及び精度を飛躍的に進展させるという方針のもとに研究を進めた。 (1)文字画像のヒストグラムを利用したノイズに強い構造情報として、縦または横の顕著な線分を持たず斜めの線分が主体となる文字の分類ができた。これにより全字種を4個のクラスの分類することが可能となった。 (2)文字画像の潰れは、縦及び横方向のヒストグラムの谷を埋めることに着目しいて、大部分が潰れの顕著な文字からなるクラスとその他のクラスに分類することを可能にした。これにより潰れも文字に重点を置いた認識手法を有効に活用することができるようになった。 (3)縦及び横方向のヒストグラムの横軸を2等分して得られる4個の領域のそれぞれにおけるヒストグラムのピークの有無により、全字種を16個のクラス分類する実験を行い、その有用性についての見透視を得た。これにより、全字種を数百程度の大きさのクラスに分類することが、より現実的なものとなってきた。 以上が平成8年度の研究実績の概要である。平成9年度はこれを基にして,飛躍的高速高精度のプロトタイプを実現する予定である。
|
-
[Publications] 木村正行: "構造情報に基づく漢字印刷文字認識" 電子情報通信学会信学技報. PRMU96-85. 37-44 (1996)
-
[Publications] 大町真一郎: "カテゴリー間分布を考慮した文字認識用マルチテンプレート辞書の構成法" 電子情報通信学会論文誌(D-II). J79-D-II,9. 1525-1533 (1996)
-
[Publications] 大町真一郎: "つぶれを考慮した低品質印刷文字の高精度認識" 電子情報通信学会論文誌(D-II). J79 D-II,9. 1534-1542 (1996)