研究課題/領域番号 |
17500096
|
研究機関 | 広島市立大学 |
研究代表者 |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
研究分担者 |
正代 隆義 九州大学, 大学院・システム情報科学研究院, 准教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
鈴木 祐介 広島市立大学, 情報科学研究科, 助教 (10398464)
|
キーワード | アルゴリズム / データマイニング / 機械学習 / 情報基礎 |
研究概要 |
IT関連技術の発達により、木構造を有するWeb文書、道路情報をグラフ構造としてもつ地図データなどさまざまなものがコンピュータで解析可能なデジタルデータとして蓄積されている。さらに、グラフ構造をもつデータは大規模化しており、解析対象であるデータを何度も精査しなければならない場合、多大なる解析時間を要する。最初の精査時に、可逆的にデータを圧縮することができれば、解析対象データのサイズをより小さくすることができ、次回からのデータ精査に必要な時間が短縮できると考えられる。この考えの元、本研究課題では、情報の欠落なく圧縮されたWeb上の文書データ、地図データ、配線図データなどのグラフ構造データから解凍することなく効率よく特徴を抽出する手法の開発を目的とする。最終年度である平成19年度は次の研究課題に重点をおいて研究を行った。 (1)可逆圧縮された大規模木構造データからのマイニング手法の設計および実装:大規模データからのマイニングへ応用するため、昨年度開発したパス探索アルゴリズムを改良した。 (2)可逆圧縮されたグラフ構造データからのデータマイニング手法の開発:これまでに可逆圧縮に関して研究してきた木の簡潔データ構造を、地図や配線図のデータモデルとしてよく使用されるTwo-Terminal Series Parallel(TTSP)グラフへと拡張し、大規模TTSPグラフに対するパス探索アルゴリズムを提案した。また、TTSPグラフは平面グラフのひとつであるが、制限された平面グラフである外平面グラフについてデータマイニング手法を提案し、その実装を行い、その有効性を示した。 (3)質問学習モデルに基づいた手法の可能性について:本研究課題の理論的基盤を広げるために、質問学習モデルに基づくグラフ構造データからの多項式回の問い合わせで学習可能であることを示した。
|