研究概要 |
本研究では,状況に応じて自ら学習方法を変更する新しいデータマイニング手法を提案し、プロトタイプシステムを開発して実験によりその有効性を示した. 現在提案されているデータマイニングシステムでは,ユーザが,対象データ形式を決定する前処理と,実際に知識を発見する知識発見に関わっており,その負担は大きい.この問題に対処するために,入力データと発見過程に応じて学習方法を変更する構成的学習法に基づき,ユーザの負担が軽い自律型知識発見手法を考案した.対象問題としては,命題属性型データから未知データのクラスを予測する分類ルールを発見する問題を選択した.この問題は,探索的データ解析や知識ベースの自動構築などの応用が考えられ,重要である. 提案手法は,解析データの自律的離散化による前処理と,発見対象知識構造の自律的決定および知識評価規準の自律的調整による知識発見の二段階から構成される.本手法は,学習アルゴリズムの構成要素であるバイアスを,それぞれ新しい規準と制約によって選択する.用意したバイアスは,離散化手法は等頻度方式とエントロピー最少化方式,知識構造は連言ルールとMofNルール,評価規準は一般性と正確性を統一的に表すJ値と条件つき確率である. 提案した手法の有効性を示すために,小売業データなどの実世界データを用いて,47種類の学習問題を設定して実験を行った.本手法は,30種類の学習問題において,クロスバリデーションによるJ値評価で最適なバイアスの組合せに比較して90%以上の成績をあげ,発見対象クラスに属するデータ数が極端に少ない場合を除いて有効であることが分かった.また,大規模な対象データを想定し,複数のパーソナルコンピュータ上で動作する並列型システムも開発した.
|