研究概要 |
本研究は, データマイニングにおけるルール評価作業において, 専門家の評価基準に適応して客観的ルール評価指標の組み合わせによるルール評価モデルを適宜構築することで支援するシステムの開発を目的としている. 本年度は, ルール評価モデルを有効に構築するため, 専門家の評価基準が客観的ルール評価指標と評価ラベルから成るデータセットにおいて判別できるか否かについて, 教師付学習における分類予測精度とその分散について評価を行った. 評価においては, 2人の専門家による別々の問題におけるルール評価結果とランダムに評価ラベルを割り当てた場合を設定した. その結果, 対象とするデータセットでは, 専門家の評価基準が含まれている場合とそうでない場合において, 評価ラベルの配分を均一にすると分類予測精度が統計的に有意に異なることをしめした. また, 分類予測精度の分散は, 有意な変化が見られないことも判明した. これらの結果について, RIKD 2008において発表し, 評価実験と考察を拡充した原著論文がFundamenta Informaticaeに掲載された. さらに, ルール評価作業を進めるにあたり, 客観的ルール評価指標の類似性情報が専門家による各指標の理解を促し, ルール評価モデル構築に必要なルール評価をより早く収集することに寄与すると考えた. このため, 様々な問題領域から収集されたベンチマークデータセットから得たルール集合について, 相関係数として得られたルール評価指標の値の振る舞いから評価の方向性が類似した指標を見いだせることを示した. この結果は, IEEE GrC2008において発表した.
|