2007 Fiscal Year Annual Research Report
数値データに対する階層化ルールと学習理論のデータマイニングへの応用
Project/Area Number |
19700003
|
Research Institution | Tohoku University |
Principal Investigator |
全 眞嬉 Tohoku University, 大学院・情報科学研究科, 助教 (80431550)
|
Keywords | アルゴリズム / 知識抽出 / 情報システム / 計算理論 / 情報基礎 |
Research Abstract |
本研究の目的はデータマイニングにおける現在の精度限界を打破するための知識抽出モデルの提案,理論研究,システムの構築である. 現行のデータベース技術では知識を引き出すために必要な規則や価値などの自動的な抽出能力に乏しい.人工知能での知識獲得方法には処理速度に問題があり,大規模データマイニングに利用しにくい欠点がある.実用データマイニングで必須である数値データベースの取り扱いを考えると,数値データの二値化誤差から生じる,正確性と学習汎用性のトレードオフに関する精度限界がある.これらの問題を解決するために,2次記憶上の巨大データベースを効率的に処理する最適化アルゴリズム研究が強く必要とされる.本研究では数値データ処理問題を計算幾何の問題に置き換えて図形の階層化ルールとして扱う. 従来,計算幾何学での図形近似理論では主にハウスドルフ距離や最大垂直距離(L∞距離)などの最大距離を最小化する基準(最大値最小化基準)をもとに構築されている.しかし,最大値最小化基準では出力の任意性があり,測定エラーに弱いという弱点があり,応用によっては十分な近似が行われないという問題点があった.その点、例えばLp距離等の積分型の大域的距離は誤測定に対して頑健であり、多くの応用において図形の大域的性質をよりよく近似できる. 本年度の研究成果として提案した数値データに対する階層化ルール理論研究としてデジタルな星領域および山方地形図の最適近似アルゴリズムを与えた.研究成果をまとめた論文がACM計算幾何国際会議Symposium on Computational Geometry2008 (SoCG08)に採択され6月に発表予定である.さらにSpecial Issue of DCG dedicated to SoCG'08に招待されている.
|