2006 Fiscal Year Annual Research Report
多様なデータも処理するラフデータマイニングツールの構築と応用
Project/Area Number |
18500214
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
酒井 浩 九州工業大学, 工学部, 教授 (60201513)
|
Keywords | ラフ集合 / ルール抽出 / データ解析 / 非決定情報システム / データマイニング / 多変量解析 / アプリオリアルゴリズム / ツールプログラム |
Research Abstract |
本研究の目的は、ラフ集合の特長を生かしてデータマイニングツールを構築し、ツールを多様な表データ(広くはデータベース)に適用し、価値ある情報の獲得支援を行うことである。平成18年度において以下の課題に取り組み、課題1と2についてはかなりの部分を仕上げている。 【課題1】表における連続値データの処理:現状では、クラスターリングやエントロピー尺度を用いて連続値の離散化が行われ、離散化されたデータにラフ集合の手法が適用されている。本研究において、我々はデータ自体の離散化を直接行うのではなく、ルールの記述言語に数値パターンの導入を行い、詳しい同値関係、あらい同値関係の定義を与え、アプリオリと呼ばれるアルゴリズムの拡張とその実装を行った。詳しさの階層性を陽に処理でき、従来とは異なる新たな連続値処理になっていると考える。 【課題2】表における離散値データの処理、情報の欠落・不完全性がある表データの処理:この課題の基礎はかなり出来上がっているので、ソフトウェアの公開も考慮して使用環境とプログラムの改善を進めた。 【課題3】数学入試問題データベースからのデータマイニング:過去問題のデータにラフ集合の手法を適用し、数学問題の特徴解析を行う。今回は特に大学入試センターの過去5年分の抄録データを作り、アプリオリアルゴリズムを適用する実験を試みた。その結果「整式の問題と除法の問題は関係深い」、「整式の問題と必要十分条件の問題は関係深い」、「余弦定理の問題と正弦定理の問題は関係深い」などの特徴あるパターンを自動的に取り出すことができた。
|