研究課題
基盤研究(C)
本研究は、シンボリック・データ・アナリシス(量的記述、質的記述の混在した対象に関する一般的なデータ解析法)に対する方法論の開発を目的としている。平成16〜17年の研究成果は以下の通りである。1)判別分析のための特徴選択法平成14〜15年度の研究成果である「記述の一般性を考慮した相互近隣グラフ」および「記述の一般性を考慮したクラス間相互近隣グラフ」に基づく特徴選択法を利用して、クラス間の構造を解析する方法を開発した。この方法においては、クラス間の境界付近の特徴的なサンプルの抽出とクラス間の分離に重要な特徴部分集合を同時的に見出すことが可能である。実際に、カリフォルニア大学アーバイン校の評価用データベースによって、提案手法の有用性を確認した(Computational Statistics Vol.21印刷中)。2)相関分析のための一般化された相関係数相関分析において、特徴間共変関係を評価する尺度が有用である。本研究では、区間を値とする特徴や有限集合を値とする特徴間についても、共変性の評価を可能とする方法の開発を目標としている。共変的な関係にある特徴組について、データサンプル群は、幾何学的に薄い構造を有するという性質に注目し、Chain connected covering(CCC)とよぶ新たな方法を見出した。線形構造を含む単調な構造は、CCCの特別な場合として検出可能であり、一般化された相関係数や一般化された主成分分析、また特徴のクラスタリングといったあらたなツールの可能性を見出した(国際会議ICCR-2005、Karnataka, India)。今後、シンボリック・データに対して、これらの有効性を確かめたい。
すべて 2006 2005
すべて 雑誌論文 (6件)
Computational Statistics 21・1(印刷中)
Computational Statistics 21-1(in press)
Proceedings of the International Conference on Cognition and Recognition, Karnataka, India ICCR-2005
ページ: 1-6
ページ: 6-12
Proceedings of the International Conference on Cognition and Recognition ICCR-2005, Karnataka, India