計算に基づいた学習において、従来の幾何的な枠組みではなく、データの組合せ的な性質を利用した新 まず(1)について、平成20年度の研究では2値分類を取扱い、離散データから2部グラフ構造を抽出する方式を提案した。この2部グラフは、データのサンプルに対応する節点と、別に与えられた決定表(あるいはその集合)のエントリに対応する節点から成り、サンプルとそれが適合するエントリに対して枝が張られる。平成21年度では、このような2部グラフを枝交差数最小化のコンセプトにしたがって空間に配置すれば、効果的な分類器として用いることができることを実験的に示した。特に重心法による配置は従来の超平面分類器と見なすことができるため、学習理論を導入することによって今後の発展が期待される。また(2)について、前述の2値分類器を多値分類器に拡張し、その汎化能力がC4.5やLibSVMなどのベンチマークアルゴリズムと比べても遜色ないことを実験的に示した。この拡張はECOCなど従来の枠組みによるものではなく、やはり枝交差数最小化に基づいた独創的なものである。 枝交差数最小化は情報可視化において広く使われる手法であるが、可視化された対象それ自体がデータの分類に関して非自明かつ有意な構造を持つという例は、これまでにほとんど報告されておらず、本研究の成果は、機械学習および情報可視化の双方の観点から興味深い。
|