研究概要 |
本研究は、シンボリック・データ・アナリシス(量的記述、質的記述の混在した対象に関する一般的なデータ解析法)に対する方法論の開発を目的としている。平成16〜17年度の研究成果は以下の通りである。 1)判別分析のための特徴選択法 平成14〜15年度の研究成果である「記述の一般性を考慮した相互近隣グラフ」および「記述の一般性を考慮したクラス間相互近隣グラフ」を利用した特徴選択法を利用して、クラス間の構造を解析する方法を開発した。この方法においては、クラス間の境界付近の特徴的なサンプルの抽出と、クラス間の分離に重要な特徴部分集合を同時的に見出すことが可能である。したがって、入り組んだクラス間の構造、重なりの多いクラス間の構造など、クラス間の構造の特徴的な性質を調べることが可能である。実際に、カリフォルニア大学アーバイン校の評価用データベースによって、提案手法の有用性を確認した。 2)相関分析のための一般化された相関係数 相関分析において、特徴間の共変関係を評価する尺度が有用である。本研究では、区間を値とする特徴や有限集合を値とする特徴間についても、共変性の評価を可能とする方法の開発を目標としている。共変的な関係にある特徴組について、データサンプル群は、幾何学的に薄い構造を有するという性質に注目し、Chain connected covering(CCC)とよぶ新たな方法を見出した。線形構造を含む単調な構造は、CCCの特別な場合として検出可能であり、一般化された相関係数や一般化された主成分分析、また特徴のクラスタリングといった新たなツールの可能性を見出した(国際会議ADCOM2005, ICCR2005に採録)。今後、シンボリック・データに対して、これらの有効性を確かめたい。
|