研究概要 |
初年度にあたる今年度は、数理計画法に基づくパタン分類問題の新たな定式化に充填を置いて研究を進めた。まず、Mangasarian、Bennettらによって提案された2次計画法であるGOPに着目した。GOPでは、頑健な識別器を構築するために、「分離超平面によるクラス間のマージン(距離)の最大化」、および「誤分類される点と離超平面との距離の総和の最小化」の2つの側面から問題を定式化している。実際、予備実験によると、正規分布を仮定したBayes識別器よりも優れた識別性能が得られることが確かめられた。そこで、2群の識別問題として定式化されているGOPを多群の識別問題に拡張することを検討した。その結果、最適性を失うことなく多群の識別問題として定式化が可能であることを新たに示した。(これを新たにGOP-MCと呼ぶ) GOP-MCの識別性能をさらに向上するには、線形な識別境界を非線形に拡張することである。そこで、Vapnikによって提案されたSupport Vector Machine(SVM)における、次元拡張法に着目した。SVMは、入力ベクトルを非線形に写像した高次特徴空間において、GOP同様の線形な識別境界を構築する手法であり、結果的に非線形な識別境界が構成される。GOP同様、SVMも2次の識別問題として定式化されている。多群の識別問題を扱う場合は、識別対象のカテゴリと、それ以外のカテゴリを識別するように問題を定式化するのが従来の手法であった。しかし、この場合は複数のSVM間を通じての最適性は保証されない。これに対して、GOP-MCで用いた複数クラス化の手法を用いると、SVMも最適性を失うことなく複数クラス化が可能となることを新たに示した。 UCIが公開する機械学習用のデータベースを用いた認識実験によると提案手法(GOP-MC,SVM-MC)が従来法(GOP,SVM)と比較して、学習外資料に対して優れた識別性能を示すことが分った。
|