本研究では、「走り書きのハングルをオンラインで認識すること」を目的とし、精度の高い認識の実現を試みる。この目的で今年度の計画は成功裏で達成された。研究実績の概要は次のとおりである。 予備実験で認識の評価のため収集したハングルデータを用いて分析を行った。認識システムとして、入力処理・前処理・DPマッチングと画間相互情報の評価・認識結果の判定の段階である。まず、アルゴリズムの最適化のため、標準パターン用のデータを用いて統計的な分析を行った。個別画情報(画の形状・位置座標・動きの変化・曲線の程度など)の分析と画間相互情報(相対的な長さ・相対的な位置・クロス点の有無など)の分析を行った。分析した情報を提案した認識アルゴリズムの枠組みに導入する。最適解として可能性が低い個別画情報と画間相互情報を後の探索から排除するという方法を用いる。次にベクトル量子化を行い、標準パターンの改良を試みた。多画の文字の場合、同じ字素を持つものが多く存在する。逆に一つの文字にはいくつか異なる字素が存在し、それらを分ける必要があるものもある。これらの字素をベクトル量子化という方法を用いて標準パターンの改良を行う。これにより、標準パターンの大幅な空間圧縮が可能になる。次に既存のアルゴリズムとの比較を行った。その優劣性について明らかにした。 最後に上記のアルゴリズムを用いて、漢字・仮名・ハングルなどの文字の総合的な環境における認識システムの開発に拡張する予定である。上記の方法は総合的な環境においてもそのまま適応できると期待される。
|