複数の関係表からなるデータベースのマイニング、即ち多関係データマイニングのための効率的手法について研究している。先行研究で関係的属性と呼ぶ基本的パターンを事例から予め抽出し、その組合せで頻出パターンを獲得する方法を提案した。20年度はこの手法についてアルゴリズムの基本設計と実装、基本動作の確認を行った。システムは2方向から研究を行ってきた。1つは、本アプローチに基づいてマイニングの機能を可能な限り引き出すことであり、他方は本システムの基本機能を大規模データベースに適用可能とすることである。この両面から20年度は成果を得ることができた。 関係属性を基本パターンの組合せで枚挙することが方針であり、この組合せに関して2つのオペレータを定義し、これの組合せでパターンを枚挙する手法を提案した。この成果は大阪で開催されたPAKDDにおいて発表した。(システム(1)) 他方、論理型言語Prologとデータベースサーバを組合せてPC上に実装し、大規模データベースをマイニング対象とするための研究を行った。この結果、基本システムをデータベースシステムと結合することが可能となった。この成果は、名古屋大学で開催された情報学ワークショップで発表し、論文奨励賞を受賞した。(システム(2)) 実験は突然変異性を有する化合物データを使用したものを予定していたが、これについてはシステム(1)での実験のみとした。しかし、これの他にWebマイニングを対象とした基本実験を進め、データの準備と基本実験を済ませた。この他、ILP手法の基本的性質に関する理論研究をすすめ、KES2008等において発表した。
|