研究課題
基盤研究(C)
IT関連技術の発達により、木構造を有するWeb文書、道路情報をグラフ構造としてもつ地図データなど様々なデータがコンピュータで解析可能なデジタルデータとして蓄積され、日々大規模化している。グラフ構造をもつデータから有益な情報を抽出しようとする要求は高まっているが、それらのデータを解析するには多くの時間とコストが必要となる。グラフ構造データを可逆圧縮することでデータサイズを小さくし、解凍することなくデータを精査することができれば解析時間を短縮できると考えられる。そこで、本研究課題では、可逆圧縮された大規模グラフ構造データから解凍することなく効率よく特徴を抽出するための基礎理論を確立し、効率的なデータマイニング手法を開発することを目的とした。本研究課題の研究成果は以下のとおりである。1.Web文書などの木構造データに対する機械学習手法および質問学習手法の開発とそのデータマイニング手法への応用を行った。2.地図や配線図などをTTSPグラフと外平面グラフでモデル化し、その機械学習手法および質問学習手法を開発し,データマイニング手法への応用を行った。3.Lempel-Zip系の文字列圧縮手法を木構造データに拡張することで、効率的な圧縮手法を提案し、評価実験を行い、その有効性を示した。順序木に対するFerraginaらの研究結果(2005年)をもとに、可逆圧縮された大規模な木に対する簡潔データ構造であるXBW表記を提案し、さらにxbw表記された可逆圧縮木上を対象とした高速パス探索アルゴリズムを提案し、評価実験を行ってその有効性を示した。4.大規模可逆圧縮木に対するXBW変換をTTSPグラフに対して適用し、XBW表記された大規模TTSPグラフに対する高速パス探索アルゴリズムを提案し、評価実験を行ってその有効性を示した。
すべて 2008 2007 2006 2005
すべて 雑誌論文 (9件) (うち査読あり 3件) 学会発表 (3件)
Proc.17th International Conference on Inductive Logic Programming(ILP-2007) 4894
ページ: 239-253
Proc. 17th International Conference on Inductive Logic Programming(ILP-2007), Refereed, Springer-Verlag LNAI 4894
IEICE TRANSACTIONS on Information and Systems, Refereed, IEICE Vol. E91-D, No. 2
ページ: 222-230
Proc. 18th International Conference on Algorithmic Learning Theory(ALT-2007), Refereed, Springer-Verlag LNAI 4754
ページ: 290-304
Proc.19th Australian Conference on Artificial Intelligence 2006(AI 2006) 4304
ページ: 332-341
Theoretical Computer Science Vol.350,No.1
ページ: 63-90
Proc. 19th Australian Joint Conference on Artificial Intelligence(AI.2006), Refereed, Springer-Verlag LNAI 4304
ページ: 67-78
Theoretical Computer Science, Refereed Vol. 350, No. 1
Proc. 15th International Conference on Inductive Logic Programming(ILP-2005), Refereed, Springer-Verlag LNAI 3625
ページ: 366-383