計算に基づいた学習において、従来の幾何的な枠組みではなく、データの組合せ的な性質を利用した新しい学習手法の開発を目指す。とりわけ代表的な学習問題である「分類」に注目し、(1)データの特徴をうまく表現する組合せ構造を抽出、(2)抽出された組合せ構造を解析することによって分類器を構成する、という2段階のアプローチを取る。 平成20年度の成果について述べる。まず段階(1)について、離散データの2部グラフによる表現を提案した。この2部グラフは、データのサンプルに対応する節点と、別に与えられた決定表(あるいはその集合)のエントリに対応する節点から成り、サンプルとそれが属するエントリに対して枝が張られる。このような2部グラフを枝交差数最小化のコンセプトにしたがって空間に配置し、配置から定められるサンプルの半順序関係を利用することによって、決定表の学習能力を向上できることを観察した(段階(2))。 枝交差数最小化が学習能力の向上につながったという事実は、情報可視化の観点から興味深い。枝交差数最小化は情報可視化において広く使われる手法であるが、可視化された対象それ自体がデータの分類に関して非自明かつ有意な構造を持つという例は、これまでにほとんど報告されていないからである。また離散的なサンプルの半順序関係に着目するアイディアもこれまでにほとんど知られていないものであり、分類における離散データの取扱いに対して新しい可能性を見出すものである。
|