複数の関係表からなるデータベースのマイニング、即ち多関係データマイニングのための効率的手法について、関係的属性と呼ぶ基本的パターンを事例から予め抽出し、その組合せで頻出パターンを獲得する方法をもとにアプローチしてきた。20年度はこのアルゴリズムの基本設計と実装、基本動作の確認を行っている。21年度は基本アルゴリズムで扱った基本パターン(関係属性)に組合せ演算子を導入し、基本パターンを組合せて網羅的にパターンを調べるアルゴリズムの開発を行った。この方法は、20年度にPAKDDで発表した方法をベースにしており、これにアルゴリズム上の工夫を施したものである。基本パターンが事例に出現する形式を保存し、この出現形式にしたがって基本パターンを組み合わせる方法である。これによって、格段に広範囲のパターンを探索することが可能となった。この研究は関係型データマイニングの主要会議ILP2010に投稿した。 これに加え、本手法のシステム化に際し可用性を高める研究を行った。1つはパターンの可視化である。論理表現は言語表現と相性がよいが、これをオブジェクトを単位とした図的表現に変えることでより一層パターンを把握しやすくなる。関係の属性がもつ、型やモードの情報を利用してオブジェクトのタイプを決定する方法を試行し、可視化の手法を与えた。また、昨年度、基本方式を確認した汎用のデータベースシステムへの接続について、アルゴリズムの全機能を利用できるよう改善し、現実的なデータを用いて評価した。この結果はKES2009およびWKDD2010において発表した。
|