2004 Fiscal Year Annual Research Report
古文書の文字認識に向けて-くずし字画像からの筆順推定と認識辞書の作成
Project/Area Number |
16700112
|
Research Institution | Osaka City University |
Principal Investigator |
安倍 広多 大阪市立大学, 大学院・創造都市研究科, 講師 (40291603)
|
Keywords | くずし字 / 文字認識 / ストローク抽出 / 古文書 / 筆順推定 / オフライン文字認識 |
Research Abstract |
平成16年度は,くずし字画像に適用可能なストローク認識手法の研究を行った.まず,2値化された文字画像(「くずし字用例辞典」(東京堂出版)をスキャンして取り込んだもの)を,交点や端点で区切られた部品(セグメント)の集合に分割する手法を開発し,得られたセグメント集合からストロークを復元することを試みた.しかし,この方法では文字の空白部分が潰れていたり,さらに潰れているところを別のストロークが横切っているような複雑な場合には対応が困難なことが明らかになった.このため,現在は次のような新しい手法を開発中である. 文字画像中の全黒ピクセルに対し,周りの全方向(360°)に線を伸ばしたときに最初に遭遇する白ピクセルまでの距離を測定する.これを,X軸を角度,Y軸を距離とするグラフに描画すると,このグラフは当該黒ピクセルに関する有用な情報源となる.例えば以下のようなことが簡単に分かる. - グラフ上で極小となる個所が2つで,極小値がどちらも一定値以下ならば,このピクセルは単純なストロークの一部であり,交点等には属さない。また,極小値の角度±90°がストロークの方向である. - 極小となる個所が1つならば,ストロークの端点である. このような情報を利用することで,確実にストロークや端点を認識できる部分と,(つぶれなど複雑な交点等の)認識が困難な部分に画像を分割することができる(プログラム開発済み).現在は,認識できた部分をヒントに,認識が困難な部分にどのようにストロークが通っているかを推定する手法の検討を行っている.具体的には,(1)ストローク候補を自動的に生成し,(2)そのストロークを実際に描いたときに,どの程度実際の文字画像と適合するかを評価することでそのストロークの確からしさを評価する手法を検討している.
|