Research Abstract |
本年度は,主に帰結指向型データマイニングの手法について研究をすすめた. 相関規則とは,データマイニングで抽出対象とする規則のひとつであり,A1∧...∧An->B1∧...∧Bnという形で表される.APRIORIとは,データベースからそのような相関規則を抽出する際に必要なアイテム集合{A1,...,An,B1,...,Bm}を抽出するアルゴリズムである. 帰結指向型相関規則マイニングとして,まず,相関規則の帰結を一つに固定した上で,相関規則の前提であるアイテム集合を拡張する.そこで,アイテム集合{A1,...,An}を単調単項式A1∧...∧Anとみなし,これを単調DNF式(A11∨...A1n)∧...∧(Am1∨...Amn)にまで拡張するそして,APRIORIを拡張する.ことで,そのような単調DNF式を抽出するアルゴリズムを提案した. APRIORIでは,アイテム集合の有意性を測るために最小支持度という尺度が用いられる.単調DNF式の抽出では,最小支持度に加えて,式の冗長性を除去するために最大重複度という尺度を導入し,それら二つの尺度を用いた単調DNF式の抽出アルゴリズムを開発した.さらに,このアルゴリズムを実装した試作システムを構築し,実際の感染症検査データベースに適用することでその有効性を検証した.実際に,MRSAデータベースから,薬剤カルバペネムに対する耐性変化に関する単調DNF式を抽出することができた. また,帰結指向型データマイニングの補足研究として,(1)計算学習理論の観点からのデータマイニングに関する研究,(2)節の既約化,および,(3)二階マッチングの計算量について研究をすすめた.(1)では文字列の生成規則の集合である基本形式体系の学習可能性と実数値関数の帰納推論可能性について論じ,特に前者は文字列を対象とした帰結指向型データマイニングに有用である.また(2)は規則の簡潔な表現のために,(3)は規則の表現力を上げるために,今後,抽出される規則を一般化する際に帰結指向型データマイニングにおいても有用となる.
|