2007 Fiscal Year Annual Research Report
構造ルールの相互影響を考慮する構造型データマイニングシステム
Project/Area Number |
18300047
|
Research Institution | Kyushu University |
Principal Investigator |
鈴木 英之進 Kyushu University, 大学院・システム情報科学研究院, 教授 (10251638)
|
Keywords | 構造ルール / 行動ルール / 領域知識の利用 / パターンの興味深さ / データマイニング |
Research Abstract |
構造ルールは,複数の関連しあうルールとして定義され,単独のルールに比較してまとまった意味を表し,ユーザが興味を抱く場合がより多いと期待される.本研究の目的は,発見候補となる構造ルールの集合とユーザが与えた構造ルールの集合が発見プロセスにおいて相互に影響し合うと仮定し,このような相互影響を考慮して興味深い発見対象を絞り込む汎用データマイニング手法を確立することである. 本年度は,昨年度開発した手法とプロトタイプシステムを分析し,効率向上を主目的に再開発を行い最終システムとした.このシステムは,行動属性などに関する領域知識を考慮して,ディスク上の巨大データから,悪いクラスを良いクラスに変更するための実現性が高い行動ルールを発見する汎用データマイニング手法となっている.各行動ルールの実現可能性は,良いクラスに属す例集合から学習した素朴ベイズ分類子を用いて評価される.米国国勢調査データなどを用いた実験により,提案手法の有効性が示された. 分析の際,構造型知識として自然と考えられる部分線形リストを,領域知識の種類を指定することなく情報圧縮に基づき発見する構造型データマイニングの着想を得た.この着想を,領域知識を考慮して例空間の一部分を説明する知識を発見する拡張最小記述原理とそのための探索手法として具体化した.探索方式は,大きく分けて全探索法と発見的探索法に分けられ,全探索法の速度を向上するための分岐限定法も考案・実装した.このアプローチに基づく手法も開発し,プロトタイプシステムとして実装した.このプロトタイプシステムを用いた初期実験により,高いノイズ耐性など種々の興味深い結果が得られた.なお,提案手法の基盤となる関連データマイニング手法や探索手法の開発も行った.
|
Research Products
(9 results)