今後の研究の推進方策 |
William LanglandのPiers Plowman, 1550年版のAI-OCRの研究を進めるために、一層詳細な検討が必要である。現在の活版印刷に使用される文字はどの文字も均質に作成され、問題がないが、初期印刷本の木版用の活字は、一般に変異の幅が大きいうえに、文字ごとに変異幅が異なるように思われる。例えば、小文字のw, a, kなどは変異幅が大きいのに対して、o, t, iなどは変異幅が比較的小さい。また、sは2種類あり、同じ文字として登録が必要になる。文字ごとに詳細に調査して問題点を指摘する。 高精度のコンピューターにより繰り返し学習させることにより、研究成果を高める必要がある。変異幅が大きい文字ほど多くの学習時間が必要となる。大文字については世紀数が少なく、比較することが困難だろう。 現在、人間の顔認証技術が進んでおり、数値化されない画像対象を特定する技術が完成しているので、そのような技術応用をすれば、将来解決できると思われる。 例えば、小文字の縦横の比率、斜線の斜度、丸み部分の曲がり具合など、文字特有の部分を抽象化して分析に応用することも検討できる。人間の視覚による認識能力は、文字全体のバランス、つまり、縦横の比率、曲線の円み・角度、斜度などにより行われると思われるが、どのような字体でもこの概念は継承されるだろう。このような文字解釈の抽象性をプログラムに組み込むことが期待される。 海外の研究者も「手書き文字」の認識に興味を持ち、研究を進めているので参考にしたい。
|