研究実績の概要 |
本研究では,曲がった文字列も対応可能な実環境文字列認識方法の開発を目的としている.文字列全体が曲がっている場合でも,文字列の一部(部分文字列)に注目すると,部分文字列は直線上に並んでいるとみなすことができる.これらの部分文字列を水平に並ぶように回転補正できたとしても,依然として部分文字列には水平方向に傾斜(せん断)が残ってしまう.この傾斜は,部分文字列全体で一様ではなく,文字位置ごとに異なっている.ただし,1文字程度の幅で見ると,傾斜はほぼ一様と近似できるものとみなす.そこで,一様に傾斜した単文字を正確に認識することで,曲がった文字列全体を認識することを目指している. 一様に傾斜した単文字を認識するために,本研究では文字に外接する平行四辺形を正方形にする正規化法を開発した.この正規化法の性能を評価するための実験を行った.実験では,(1)傾斜した文字を開発した方法で正規化した文字を学習させる方法,(2)傾斜した文字をそのまま学習させる方法,(3)正立した文字だけを学習した方法,の3つの場合について行った.なお,文字認識系として,方向線素特徴量と部分空間法を用いた方法,畳み込みニューラルネットワーク(CNNと呼ぶ)の2種類を用いた.対象は,3,169 字種(漢字,かな,カナ,英数字)とし,評価文字は学習させた文字と異なる角度で傾斜させた. 実験の結果,2種類の認識系のどちらについても以下のことが分かった. ・正立文字だけを学習させるより,傾斜した文字を学習させるほうが,傾斜文字の認識率が向上する. ・傾斜した文字を学習させるより,開発した方法で正規化した文字を学習させるほうが,傾斜角度によらず文字の認識率が向上する.
|