研究概要 |
初年度は1)属性選択法の開発・体系化,2)帰納的属性構成法の開発の2課題を中心に実施した. 1.属性選択(データクリーニング)手法の体系化 属性の集合の良さを表す指標として,距離尺度,不確実性尺度,依存性尺度,整合性尺度,誤差尺度を,探索手法として,最適解を必ずしも保証しないヒューリスティックス手法,最適解を保証する探索法,計算資源が十分あれば最適解を保証するランダム法を検討し,どのような尺度・探索法の組合わせがよいかを,すでに公表されている手法も含めて総合的に検討し,新しい手法を提案し,属性選択手法を体系化した. 2.帰納的属性構成法の開発 基本属性だけではデータの特徴の本質を表現出来るとは限らない場合の有効な解決策を,研究代表者らが提案したグラフに基づく帰納推論法とデータマイニングの分野で開発されて来た多頻度集合を求める手法をグラフ構造データに拡張し,あらたな部分構造を新属性とする帰納的属性構成法を開発した.
|