本研究は、シンボリック・データ・アナリシズ(量的記述、質的記述の混在した対象に関する一般的なデータ解析法)に対する方法論の開発を目的としている。平成14〜15年度の研究成果は以下の通りである。 1)判別分析のための特徴選択法 「記述の一般性を考慮した相互近隣グラフ」とよぶ重み付きグラフと、「記述の一般性を考慮したクラス間相互近隣グラフ」とよぶ重み付きグラフを導入することによって、概念クラス間の違いを与えるサンプル群を、それらがどのような特徴組によって記述されるかを、単純な演算で抜き出す方法を提案した。本来、特徴選択には全数探索という計算量の爆発の問題がつきまとい、したがって特徴組の評価法を簡略化する妥協が強いられる。本研究では、複数の特徴組を同時に用いなければ識別出来ない問題を含め、提案の方法が高い特徴選択能力を有することを実験的に確かめている。 2)相関分析のための一般化された相関係数 相関分析において、特徴間の相関の程度を評価する尺度が有用である。本研究では、2つの特徴の間に因果性があれば、例えば任意の関数のグラフのように、サンプルの集団は、そのようなグラフに沿った幾何学的に薄い構造を有する。このようなサンプルの分布の幾何学的な厚みを合理的に評価する尺度として、カルホーン相関係数を握案した。しかし、3次元以上の高次元空間における幾何学的な厚みの合理的評価法に拡張することは難しい。そこで、相対近隣グラフとその一般型である記述の一般性を考慮した近時グラフの概念を導入して、これらのグラフの性質から幾何学的な厚みを評価する方法を考察した。多次元空間における単調なロープ状分布については、信頼性の高い評価が可能である。しかし、3次元パラボラのような空間的広がりを有する構造の合理的評価が、今後の課題である。
|