研究課題/領域番号 |
17500096
|
研究種目 |
基盤研究(C)
|
研究機関 | 広島市立大学 |
研究代表者 |
内田 智之 広島市立大学, 情報科学部, 助教授 (70264934)
|
研究分担者 |
中村 泰明 広島市立大学, 情報科学部, 教授 (10264946)
正代 隆義 九州大学, システム情報科学研究院, 助教授 (50226304)
鈴木 祐介 広島市立大学, 情報科学部, 助手 (10398464)
宮原 哲浩 広島市立大学, 情報科学部, 助教授 (90209932)
|
キーワード | アルゴリズム / データマイニング / 機械学習 / 情報基礎 |
研究概要 |
IT関連技術の発達により、木構造を有するWeb文書、道路情報をグラフ構造としてもつ地図データなどさまざまなものがコンピュータで解析可能なデジタルデータとして蓄積されている。さらに、グラフ構造をもつデータは大規模化しており、解析対象であるデータを何度も精査しなければならない場合、多大なる解析時間を要する。最初の精査時に、可逆的にデータを圧縮することができれば、解析対象データのサイズをより小さくすることができ、次回からのデータ精査に必要な時間が短縮できると考えられる。この考えの元、本研究課題では、情報の欠落なく圧縮されたWeb上の文書データ、地図データ、配線図データなどのグラフ構造データから解凍することなく効率よく特徴を抽出する手法の開発を目的とする。この目的を達成するために、初年度である平成17年度は次の研究課題に重点をおいて研究を行った。 (1)グラフ構造データからの各属性の抽出手法の開発 グラフ構造をもつデータからの各種属性の抽出手法についての基礎研究を行った。併せて、すでにデジタル化されているグラフ構造データおよびグラフ構造を自動抽出できそうな印刷物の収集を行った。 (2)効率的な圧縮手法の開発 木構造文書の有している木構造及びテキストを同時に可逆圧縮する効率的な手法の提案および実装を行った。現在は、さらなる改良を行っている。 (3)グラフパターン照合アルゴリズムの設計 基礎研究として、正データからの有限和に関する多項式時間帰納推論可能性および質問学習について検討を行った。現在は、圧縮データを対象とした機械学習についての研究を行っている。 (4)グラフパターン発見手法への応用を目指した基礎研究 可逆圧縮されたグラフ構造データからのグラフパターン発見手法の開発時におさえておかなければならない諸問題を同定するための基礎研究を行った。
|