研究課題
1)幾何構造データの圧縮手法の効率化:本年度は、これまでに得られた知見をもとに、幾何構造データに対するより効率のよい圧縮手法の開発および電気配線図面の実データや巨大な人工データを用いた評価実験を行い、その有効性を示し、国際会議(ASGIS2004)で発表を行った。この手法は、、同型な部分グラフを変数に置き換え、その置き換え規則を代入という概念を用いることにより、可逆性を保ちかつ構造を保持しながら表現グラフのノード数の削減を行うというものである。2)圧縮グラフデータ上のパターン照合アルゴリズムの開発および実装:このパターン照合アルゴリズムの高速化は、本研究で作成を目指すデータマイニングシステム全体の効率性に大きく影響を与えるものである。Tを木構造文書とし、tを項木とする。Tを圧縮して得られる項木fと代入θが与えられたとき、tの変数に適当な木を代入することでTと同系な木fθを作り出すことができるか否かを判定するパターン照合問題を解くパターン照合分散アルゴリズムの設計を行い、現在そのプロトタイプを作成中である。今後、この分散アルゴリズムの有効性を確かめるため評価実験を行い、国際会議に投稿する予定である。本研究の基本コンセプトにおいて、構造的な特徴を保持しつつ頻出する部分構造を変数に置換えるため、可逆的なノード数の削減が可能であり、さらにデータマイニングシステム全体の自明でない分散化に対する指針を与えることができ、PCクラスタを用いることにより、より高速なデータマイニング手法の設計が可能であるという知見を得た。この知見をもとに、さらなる拡張を行い、本研究課題をより発展させていく予定である。本年はまとめの年であり、本研究課題の成果の一部は国際会議で公表することができたが、数件の論文は受理されなかったため、これら論文の公表も今後行う予定である。
すべて 2004
すべて 雑誌論文 (3件)
Journal of Chongqing University of Posts and Telecommunications Vol.16,No.5
Proc.8th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2004) LNAI 3056
ページ: 341-350
ページ: 133-144