2006 Fiscal Year Annual Research Report
可逆圧縮された大規模グラフ構造データからのデータマイニング手法の開発
Project/Area Number |
17500096
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 広島市立大学, 情報科学部, 助教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 九州大学, 大学院システム情報科学研究科, 助教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学部, 助教授 (90209932)
鈴木 祐介 広島市立大学, 情報科学部, 助手 (10398464)
中村 泰明 広島市立大学, 情報科学部, 教授 (10264946)
|
Keywords | アルゴリズム / データマイニング / 機械学習 / 情報基礎 |
Research Abstract |
IT関連技術の発達により、木構造を有するWeb文書、道路情報をグラフ構造としてもつ地図データなどさまざまなものがコンピュータで解析可能なデジタルデータとして蓄積されている。さらに、グラフ構造をもつデータは大規模化しており、解析対象であるデータを何度も精査しなければならない場合、多大なる解析時間を要する。最初の精査時に、可逆的にデータを圧縮することができれば、解析対象データのサイズをより小さくすることができ、次回からのデータ精査に必要な時間が短縮できると考えられる。この考えの元、本研究課題では、情報の欠落なく圧縮されたWeb上の文書データ、地図データ、配線図データなどのグラフ構造データから解凍することなく効率よく特徴を抽出する手法の開発を目的とする。この目的を達成するために、中間年度である平成18年度は次の研究課題に重点をおいて研究を行った. (1)効率的な圧縮手法の開発 これまで開発してきた圧縮アルゴリズムの改良を行い、実装した上でその有効性をした。 (2)グラフパターン照合アルゴリズムの設計および可逆圧縮された大規模木構造データからのマイニング手法の設計および実装 Paolo Ferraginaraら(Proc.46^<th> FOCS,2005)により提案された木の表現方法であるxbw表記を本研究課題で提案した圧縮木に拡張し、xbw表記された圧縮木に対する高速なパス探索アルゴリズムを提案し、実装を行い、評価実験を行った。このパス探索アルゴリズムは、グラフパターン照合アルゴリズムのベースとなるものである。評価実験により、解凍後にパス探索を行うより圧縮木に対するパス探索アルゴリズムの方が高速であることが確認できた。 (3)グラフ構造データからのデータマイニング手法の開発 17年度に行った木構造データに対するグラフパターン発見アルゴリズムの設計において得られた知見を基にTwo-Terminal Series Parallelグラフの族を対象とした発見手法の元となる機械学習アルゴリズムを提案した。さらに、混在するデータからのデータマイニング手法として有限和を学習するアルゴリズムを提案した。
|
Research Products
(4 results)