クラス数が非常に多い場合の多クラス識別問題は、入力パターンがどのクラスに最も近いかを判定する最近接探索問題の一つであると考えることができる。手書き文字(漢字、ひらがな)認識は、このような多クラス識別問題の典型例である。本年度は、この認識手法の高速化、高度化の研究を実施した。 多クラス探索は2クラス識別に基づいて実行する場合が多い。このとき、2クラス毎の識別器の組み合わせに基づく代表的手法にWinMax法があるが、この手法はクラス数がnの場合n(n+1)/2回の判別を必要とし、時間がかかるという問題がある。これを解消するために、DAG(Directed Acyclic Graph)構造を利用することによりn回の判別のみで最近接クラスを決定する手法が提案されているが、誤識別を行った際、解として提示されるクラスと真のクラスとの距離(類似度)が必ずしも高くないという問題がある。 本研究では、SVM(support vector machine)を2分識別器として用い、近接クラス群毎にクラスタリングを行い、全体としてはDAGを用いるものの、各クラスタ内ではWinMax法を用いることにより、検索の高速化と順位正解性を向上させる手法を考案した。このとき近接性は各SVMの判別誤差に基づいて行うが、これは一般に求めることができないため、何らかの推定量で代用する必要がある。本研究ではSVMのLagrange係数の役割に着目したヒューリスティックな指標を考案し、これを用いたくラスタリングを実行することにより、DAG構造に起因する高速検索性を損なうことなく、順位正解性を向上されることが可能であることを手書きひらがなデータを用いた実験により確認した。
|