前年度はLocally Likely Arrangement Hashing (LLAH)を文字の連結成分の認識の使用できるかについて検討し、文字が相似変換を受けた場合については高速な認識が可能になった。本年度は前年度の成果を拡張して、アフィン変換を受けた文字の高速な認識の実現方法について検討した。 まず検討したのは、連結成分を正規化する方法である。アフィン変換を受けた図形を正規化する方法は既にLeuによって提案されていたが、この方法は回転方向の正規化はできないため、Leuの手法を適用した後に何らかの方法で回転方向の照合を行う必要があった。そこで、回転方向と字種の高速な照合を行うprogressive pruningという方法を提案した。この成果はMIRU2008とDAS2008で発表した。 次に検討したのは、Geometric Hashing(GH)と呼ばれる特徴点ベースの手法を連結成分の認識に使用し、さらに幾何学的不変量の計算原理を通常とは異なる方法で用いることである。この方法により、特徴点数をPとしたときの計算量をGHではO(P^4)必要だったのが提案手法ではP(O^2)に削減することができた。実験により、射影変換を受げた文字画像を約80%の認識精度で、1秒間に200〜250文字の認識が可能であることを確認している。本研究の成果は、平成21年3月の電子情報通信学会PRMU研究会で発表した。また、年度が変わり、研究期間が終了してしまうが、6月のSSII09、一月のMIRU2009とICDAR2009で発表予定である。
|