知識発見手法を実装するための基本技術として列挙アルゴリズムが広く用いられており、様々なデータに対して適用可能になっている。しかし列挙アルゴリズムは、入力データのサイズが増えるにともなって、その出力のサイズが膨大になるという性質があるため、その出力を解釈することが困難である。
本研究の目的は、主に構造データを対象として、そのデータが持つ性質や、データ間の関係を利用することで、より扱いやすい知識発見手法を達成するための技術を研究し、最先端の知識発見手法を構築することである。今年度は特に、データの関係性をデータの処理に直接的に利用する処理を組み込んだ列挙アルゴリズムを用いた手法の構築について研究を行った。
具体的な問題の定式化として、(1)列挙アルゴリズムに基づくパターン発見手法の出力を一部選択することで、有用だと思われる解を少数だけ出力するパターン集合発見問題と、(2)パターン発見のための記号インデクス化に関して議論した。いずれの手法も計算機実験を通じてその性能や性質を議論し、今後のさらなる発展のために重要な結果を得た。
|