研究概要 |
研究実績は以下のとおり. 1.属性選択(データクリーニング)手法の実装 前年度に検討した手法を実装し,個別のデータを種々の手法に適用し,結果を比較評価した.その結果を踏まえ,データの特徴と適切な属性選択法の対応を一般的に整理し,属性選択法に対する設計指針を与えた.とくに,不整合性を指標とすれば,属性集合に対し単調性を有するため分岐限定法を用いて完全探索を効率良く実施できることを確認した. 2.データ量削減のための規範の実装と評価 事例選択(Instance selection)法のサーベイを実施し,最新の成果を広く世界に呼びかけ,22件の論文を選定し,Kluwer Academic Publishersから共同研究者のHuan Liu助教授との編書:Insance Selection and Construction for Data Miningとして出版した.また,ランダムサンプリングとコミッディー学習を組み合わせた方式を実装し,多くの事例に適用し,データ量削減を定量的に評価した. 3.帰納的属性構成法の開発と実装 グラフに基づく帰納推論法を拡張し,連結性の一般グラフまで扱えるようにした.高速化に注力し,グラフのサイズにほぼ線形な時間で多頻度部分グラフを抽出可能とした.抽出した多頻度部分グラフを新たな属性とし分類器の入力にする多戦略学習法を提案し,変異源性物質の解析に適用した.
|