研究概要 |
シンボリック・データ(量的な記述や質的な記述の混在を許した一般的なデータ)について,近隣集合を利用した鎖状接続や単調な鎖といった概念を提案した.伝統的な多変量解析法である,主成分分析法や重回帰分析法が,直線的構造の検出や,当てはめを目的としていることに対比して,単調性という,より広範な構造を,関数の形を仮定せずに一括りにして扱うことが可能である. 有限個の個体列の単調性を,個体対の構成するカルテシアン・ジョイン領域(矩形領域の一般化概念)の入れ子構造によって特性付けられることを指摘し,次の成果が得られた. 1)個体列の多次元空間における入れ子構造が,各特徴軸においても同じ入れ子構造として保存される性質に基づき,特徴間の親近性の尺度を定義した.この尺度を用いると,特徴のクラスタリングを行うことが可能であり,多次元シンボリッック・データに内在する,個体列による単調な鎖を検出可能であることを示した(P.Brito他編集の書に収録). 2)各特徴軸における入れ子構造と近隣集合の性質を利用した数量化を行う事で,シンボリック・データの主成分分析が可能であることを示した.また,単調性の性質に基づいて,N個のシンボリック・オブジェクトのそれぞれを,最大オブジェクトと最小オブジェクトに分割することで,シンボリッック・データを2N個のオブジェクトからなる通常の多変量データとして主成分分析が実行可能であることを示した(ISI2007で発表).
|