研究概要 |
本研究は,スケジューリング機能を持つ例外ルールと常識ルールの同時発見手法を提案し,大規模データヘの適用を通してその有効性を評価することが目標である.本年度は,閾値スケジューリングを提案し,基盤システムの実装,予備実験を行った.また,医学データからの例外事例の発見などに関しても成果をあげた. ・まず,複数の評価指標を持つ発見パターンを効率的に管理する新しいデータ構造を提案した.このデータ構造は,各指標に1本の平衡探索木を割り当てるものであり,ノードはパターンヘのポインタを表す. ・次に,発見ルールの制約条件を緩和する閾値スケジューリングを実現した.この方式では,上記のデータ構造にあらかじめ指定した数のパターンが保存され,新しいパターンが発見された場合,決められた方針にしたがって不要パターンが削除され,閾値が更新される.方針としては,完全に閾値更新を指定するものと,対象指標を順々に変更する方法を考えた. ・次に,提案したスケジューリング機能を例外ルールと常識ルールの同時発見手法に組み込み,基盤システムを実装した. ・最後に,大規模な実データを4種類用いて予備実験を行った.実験の結果,提案手法の有効性と幅広い用途が実証された.また,抗生物質などに関するきわめて興味深い知識が発見された. ・なお,例外ルールと常識ルールの同時発見について,手法と応用の両面で成果をあげた.また,例外事例の発見手法として,サポートベクターマシーンに基づく新手法を開発し,医学データなどでその有効性を確認した.
|