2008 Fiscal Year Annual Research Report
数値データに対する階層化ルールと学習理論のデータマイニングへの応用
Project/Area Number |
19700003
|
Research Institution | Tohoku University |
Principal Investigator |
全 眞嬉 Tohoku University, 大学院・情報科学研究科, 助教 (80431550)
|
Keywords | アルゴリズム / 知識抽出 / 情報システム / 計算理論 / 情報基礎 |
Research Abstract |
本研究の目的はデータマイニングにおける現在の精度限界を打破するための知識抽出モデルの提案, 理論研究, システムの構築である. データマイニングにおいて, パターンマッチングなどでの計算幾何学手法の導入は与えられていた. しかしながら, 数値データベースの幾何学的な相関の最適化を行うためにはアルゴリズム理論上の様々な困難性や計算限界が生じ, 適切な定式化によりそれらの克服を行う必要がある. 本研究は最適階層構造を用いた結合ルールという知識の幾何学的表現法を提案する. 2次記憶上の巨大データベースを効率的に処理する最適化アルゴリズム研究が強く必要とされる. 本研究では数値データ処理問題を計算幾何の問題に置き換えて図形の階層化ルールとして扱う. d-次元グリッド上の中心点oから各グリッド点pへ向かうデジタル直線dig(op)の集合の数学的に整合的な定義を与えた. 各デジタル直線はdig(op)は点oと点pの間のユークリッド線分opを近似し、すべてのデシタル直線の集合がユークリッド公理に類似した公理系を満たす. デジタル直線と対応するユークリッド線分の間の近似誤差は最大ハウスドルフ距離で評価し、n×nグリッド平面内での誤差に対し、漸近的に最適な[〇!H]log nの誤差限界を与えた. 誤差限界の証明はディスクレパンシー理論とシンプルな構築アルゴリズムに基づいている. さらに、デジタル直線の単調性がなければ、誤差限界は〇(1)に抑えられることを示した.
|