2007 Fiscal Year Annual Research Report
多様なデータも処理するラフデータマイニングツールの構築と応用
Project/Area Number |
18500214
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
酒井 浩 Kyushu Institute of Technology, 工学部, 教授 (60201513)
|
Keywords | ラフ集合 / ルール抽出 / データ解析 / 非決定情報 / 不完全情報 / データマイニング / 多変量解析 / アプリオリアルゴリズム |
Research Abstract |
本研究の目的は、ラフ集合の特長を生かしてデータマイニングツールを構築し、ツールを多様な表データ(広くはデータベース)に適用し、価値ある情報(具体的には相関ルールと呼ばれる含意式「ある条件が成立する場合、特定の状況が恒常的に起きる」)の獲得支援を行うことである。下記2つの課題でかなりの進展があった。 1.表における連続値データの処理 数値パターンの導入を行い、詳しい同値関係、粗い同値関係の定義を与え、アプリオリと呼ばれるアルゴリズムの拡張を行い、Visual C#言語によりユーザインターフェースを持つツールを実現した。連続値処理は、通常、クラスタリングなどの手法によりデータ自体の離散化を行うが、提案手法ではデータに何の離散化も施さず、同値関係の階層性を利用することで詳しい相関ルールや粗い相関ルールの獲得が可能になった。従来にない連続値データ処理になっていると考える。 2.表における離散値データの処理、情報の欠落・不完全性がある表データの処理 情報の不完全性を処理するために起こり得るすべての場合を列挙し、それら全場合の動向によって相関ルールを取り出す手法は従来から知られており、最も自然な方法である。しかし、通常、起こり得る場合の数は指数関数的に増加するので、本手法はデータサイズの面において問題があった。我々は、ラフ集合の粒状計算の枠組みとアプリオリアルゴリズムの拡張を行うことにより、起こり得る場合の数に関係しないアルゴリズムを提案し、そのプログラムを実現した。本プログラムも従来にない新しい機能を有しており、不完全情報からの相関ルール生成における極めて重要な枠組みとツールを提供すると考える。
|
Research Products
(9 results)