本研究では、多画文字のオンライン認識において、手書きの筆順変動・画数変動・大幅な変形(形状・位置・回転)に対しても安定し、精度の高い認識を実現することを目的とした。今年度、本研究においてこの目的の達成に成功した。研究実績の概要は次のとおりである。 開発した認識アルゴリズムの最適化を行った。まず、標準パターン用の120人分のデータを用いて統計的な分析を行った。文字の幾何学的特徴である画間相互情報(相対的な長さ・相対的な位置・交点の有無など)と個別画情報(各画の形状・位置座標・動きの変化など)の分析を行った。分析した情報を提案した筆順自由・画数自由の枠組みに導入し、精度の高い認識が可能になることを示した。さらに標準パターンの改良を試みた。多画の文字の場合、同じ字素(または画)を持つものが多く存在する。逆に一つの文字にはいくつか異なる字素が存在し、それらを分ける必要があるものもある。これらの字素をK-meansクラスタリングアルゴリズムを基にしたベクトル量子化を行い、標準パターンの改良と圧縮を行った。これにより、標準パターンの辞書の大幅な空間圧縮(10%まで低減)が可能になった。次に、GLVQ(Generalized Learning Vector Quantization)アルゴリズムのを用いて標準パターンの最適化を行い、認識率の低減がなく、大幅な圧縮が出来ることを示した。この標準パターンの辞書はPDAなどの携帯機器における使用に対して効果的である。さらに筆順自由・画数自由の枠組みに対して改良した標準パターンをそのまま、導入できる。また、これらの情報は文字の質・ユーザの要求・システムの要求に応じて圧縮する量を設定することが可能である。今後は、開発した認識アルゴリズムを基にして、ペンを用いた実用的なアプリケーションシステムを開発する予定である。
|