Research Abstract |
本研究では,論理簡単化技術を応用したデータベースからの知識発見に関する研究を行った.決定木やラフ集合によるデータマイニングと同様,本研究で取り扱った論理簡単化に基礎を置くデータマイニングも,if-then形式の決定ルールにより知識が発見される.このため,回帰分析等の多変量統計解析などと比較して,その可読性は極めて高いことが特徴である.この特徴が主な理由によって,近年では感性工学の分野で,決定ルールによるデータマイニング技法は活発に応用されている. まず,本研究ではESPRESSO-IIと呼ばれる論理簡単化アルゴリズムを参考に,決定ルール発見システムを開発・改良し,コンピュータによる比較実験を行い,本システムの有効性を確認した.比較実験の内容は以下の通りである.比較アルゴリズムは2つ選択した.一つは決定木発見アルゴリズムのC4.5,他の一つはラフ集合によるアルゴリズムであるRSESである.また,ベンチマーク・データとしては,UCI Machine Learning Data Repositoryより,Balance-scale, Car, Nurseryの3種類を選択した.実験結果の詳細は省略するが,概ねいずれの場合においても,発見された決定ルール数および処理時間(CUP時間)は,本システムが他の2つのシステムより優れており,本システムの有効性が確認できた. 決定ルールは,同一カテゴリに属するサンプルが分布する領域を直接指定する.従って,決定ルールはパターン認識への応用が可能である.本研究では,決定ルールのパターン認識への応用可能性も模索した.具体的には,オフライン手書き文字認識への応用を試み,決定ルールに基づく識別システムを施策し,手書き文字のベンチマーク・データであるETL8を用いて,本システムの識別能力の計算機実験を行い,本手法の有効性が検証できた.
|