研究概要 |
本研究の目的は,各種学習に基づく興味深い例外を巨大データから統一的に発見するデータマイニング手法を研究開発し,実データを用いた実験における専門家の評価で手法の有効性を実証することである.手法としては各種の例外発見が他の例外発見に影響を及ぼし合い興味深い知識候補が求まる過程を対象とし,評価実験においては商業・医学データなどからの発見結果を有用性,新規性,および妥当性などの観点から専門家たちに評価してもらうことに重点を置いた. 本年度の目標は,(1)各発見問題における例外発見手法の開発整備,(2)開発した例外発見手法の実験評価,および(3)統一的例外発見手法の研究である. (1)に関しては,サポートベクターマシン,花つき決定木,例外ルール発見,およびブースティングなどに基づく例外発見手法を開発整備した.これらは統一的例外発見の基盤手法となりうるだけではなく,各種例外発見に関するより深い理解を可能とした.なお大量データヘの対処法としては,主にデータ圧縮について研究した. (2)に関しては,上記の例外発見手法を実験で評価すると共に,共通問題を用いた知識発見手法の組織的評価の場であるデータマイニングコンテストについて総括した.評価においては,人工データだけではなく,医療データや商業データなども整備して用いた.これらにより,来年度に行う予定である最終評価の準備が整った. (3)に関しては,連鎖的に例外ルールを発見するシステムの構築などを通して最終システムの構成を計画検討すると共に,統一的発見の基盤理論として新しいルール発見の最悪解析を行った.この最悪解析はその一般性と正確性が確実に信頼できるルールのサンプル複雑度を与え,発見基礎論としても重要である.
|