配分額 *注記 |
10,700千円 (直接経費: 9,500千円、間接経費: 1,200千円)
2007年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2006年度: 5,500千円 (直接経費: 5,500千円)
|
研究概要 |
構造ルールは,複数の関連しあうルールとして定義され,単独のルールに比較してまとまった意味を表し,ユーザが興味を抱く場合がより多いと期待される.本研究では,発見候補となる構造ルールの集合とユーザが与えた構造ルールの集合が発見プロセスにおいて相互に影響し合うと仮定し,このような相互影響を考慮して興味深い発見対象を絞り込む汎用データマイニングシステムを確立した. まず,所属クラスを望ましいクラスに変更するために可変属性値の変更を提案する行動ルールを発見対象の表現として選択し,発見方式を考案してプロトタイプシステムとして実装した.このシステムは,行動属性などに関する領域知識を考慮して,ディスク上の巨大データから,悪いクラスを良いクラスに変更するための実現性が高い行動ルールを発見する汎用データマイニング手法となっている.各行動ルールの実現可能性は,両クラスに属す例集合から学習した素朴ベイズ分類子を用いて評価される.米国国勢調査データなどを用いた実験により,提案手法の有効性を示した. 次に,構造型知識として自然と考えられる部分線形リストを,領域知識の種類を指定することなく情報圧縮に基づき発見する構造型データマイニングの着想を得た.この着想を,領域知識を考慮して例空間の一部分を説明する知識を発見することを補助する拡張最小記述原理とそのための探索手法として具体化した.探索方式は,3種類の発見的探索法を試み,最も記述長が短い仮説を返す方法である.これをプロトタイプシステムとして実装し評価したところ,高いノイズ耐性など種々の興味深い結果が得られた.なお,提案手法の基盤となる関連データマイニング手法や探索手法の開発も行った.
|