本年度の研究は、文字画像を確率的にモデル化する上で必要となる汎用的な手法の考察を中心に行った。一般的に文字画像は何らかの方法でベクトル化したうえで辞書を作り、辞書中のデータとの比較でその認識を行うことが多い。多くの場合、複数の方法でベクトル化した文字画像に対し、それぞれ対応するベクトル空間において近いと判断される辞書中のデータのうち、最適なものを選ぶ方法をとる。このとき、どれを選ぶかを決める際には確率的にモデル化した上で統計的に処理をする手法がいくつかあるが、どのような方法が効果があるのかを探ることにより、そこに内在する確率空間としての特徴が明らかにされると考え、その解析を行った。結果、ベクトル化の方法ごとに空間内で近い順に並べた際に何番目にくるかをポアソン分布で近似したモデルが有効であるという結論に至った。このモデルは従来の「順位による投票」による手法を理論的に解析することにより得られたモデルであり、ここではさらにベクトル空間内の距離による条件付き分布を考えたうえでのパラメータの推定を行いその精度を上げることに成功している。(平成13年3月15日電気通信学会PRMUにおいて発表)その他、数式における空間内の配置の分布を用いた数式の構造解析、方向線素特徴量を用いた文字認識などの具体的な対象に対する解析を行う中で、来年度以降の研究のための準備を行うとともに、オンライン、オフラインの両方を想定した手書きの数式のデータを謝金によるアルバイトで作成するなど今年度の研究を融合するための準備が整った状態である。
|