研究課題
若手研究(B)
多次元データベースから知識獲得をおこなうときに直面する困難な点というのは、統計的手法に体表されるようなモデルを仮定してそのモデル自身やサンプルの当てはまり具合を議論する、あるいは与えられたデータ集合が持っている構造をできるだけ忠実に把握するようことを目指して手法の選択および開発をおこなうかというどちらの姿勢で取り組むかということである。本研究では、上述の後半、あらかいじめデータ構造を仮定せずにできるだけデータ構造にそった表現形式で把握することをねらいとしている。具体的には、データ(サンプル)の層別問題、それぞれの部分集合の特徴の抽出を同時に考えることである。また、様々な複雑なデータベースに対応する為に数値属性、記号属性の両方が存在するようなケースを想定している。本研究では、各属性値軸上における類似度およびデータ間類似度を定義する。記号属性の類似度はあらかじめその属性について知見があるならばそれを取り込んだ類似度を用いるように柔軟に対応することとする。データ空間に存在するエージェントは、それまでにデータ空間に存在するエージェントが把握している特徴具合に応じて、あらたに生まれ、新しいエージェントは、それらの類似度を用いて、データベースの特徴を把握する為にいくつかのデータ部分集合と属性部分集合をダイナミックに同定する。これにより、各エージェントがもつ集合に応じて、分布をもつ部分層を表現する知識形式、あるいは、線形構造をもつ部分層を表現する知識形式を選択する。また、同時に、それぞれに応じたその知識形式を形成する属性を各エージェントがもつ集合群により、選択する。本研究では、人口データやwebなどで公開されているテストデータを用いて実験を行なってきたが、いずれも良好な結果を得た。今後はより高次元データベースに適用し、より効率的なアルゴリズムの開発、および、さらに本手法の有用性を探っていく。
すべて 2005 2004 その他
すべて 雑誌論文 (3件) 文献書誌 (8件)
European Journal of Operations Research
SYSTEMS AND HUMAN SCIENCE FOR SAFETY, SECURITY, DEPENDABILITY, (eds.T.Arai, S.Yamamoto, K.Makino)(ELSEVIER)
ページ: 77-87
Proc.of 5^<th> International Symposium on Knowledge and Systems Sciences
ページ: 97-102