研究概要 |
本研究の目的は,各種学習に基づく興味深い例外を巨大データから統一的に発見するデータマイニング手法を研究開発し,手法の有効性を実データを用いた実験における専門家の評価によって実証することである.手法としては各種の例外発見が他の例外発見に影響を及ぼし合い興味深い知識候補が求まる過程を重視した.評価においては,通常の機械学習で用いられる正答率ではなく,データマイニングで重視される興味深さを目標とした. 本年度の目標は,統一的例外発見手法の開発と最終実験である.まず,各例外発見手法を統合して統一的例外発見手法を開発し,計算機上に実装した.統合に際しては前年度の実験結果を考慮し,発見知識の有用性と手法の効率性の両立を目指した.統一的手法の開発においては,必要に応じて各例外発見手法を改良した.予備実験の結果により,昨年度に開発整備した例外発見手法の内,例外ルール発見手法とブースティングに基づく異常値発見手法を用いる統一的例外発見手法を,最終システムとした. 年度の後半においては,実装した統一的例外発見手法を整備した巨大データに適用する最終実験を行った.実験においては,共通問題を用いた知識発見手法の組織的評価の場であるデータマイニングコンテストについて総括が有用であった.
|