• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

可逆圧縮された大規模グラフ構造データからのデータマイニング手法の開発

Research Project

Project/Area Number 17500096
Research Category

Grant-in-Aid for Scientific Research (C)

Research InstitutionHiroshima City University

Principal Investigator

内田 智之  広島市立大学, 情報科学部, 助教授 (70264934)

Co-Investigator(Kenkyū-buntansha) 中村 泰明  広島市立大学, 情報科学部, 教授 (10264946)
正代 隆義  九州大学, システム情報科学研究院, 助教授 (50226304)
鈴木 祐介  広島市立大学, 情報科学部, 助手 (10398464)
宮原 哲浩  広島市立大学, 情報科学部, 助教授 (90209932)
Keywordsアルゴリズム / データマイニング / 機械学習 / 情報基礎
Research Abstract

IT関連技術の発達により、木構造を有するWeb文書、道路情報をグラフ構造としてもつ地図データなどさまざまなものがコンピュータで解析可能なデジタルデータとして蓄積されている。さらに、グラフ構造をもつデータは大規模化しており、解析対象であるデータを何度も精査しなければならない場合、多大なる解析時間を要する。最初の精査時に、可逆的にデータを圧縮することができれば、解析対象データのサイズをより小さくすることができ、次回からのデータ精査に必要な時間が短縮できると考えられる。この考えの元、本研究課題では、情報の欠落なく圧縮されたWeb上の文書データ、地図データ、配線図データなどのグラフ構造データから解凍することなく効率よく特徴を抽出する手法の開発を目的とする。この目的を達成するために、初年度である平成17年度は次の研究課題に重点をおいて研究を行った。
(1)グラフ構造データからの各属性の抽出手法の開発
グラフ構造をもつデータからの各種属性の抽出手法についての基礎研究を行った。併せて、すでにデジタル化されているグラフ構造データおよびグラフ構造を自動抽出できそうな印刷物の収集を行った。
(2)効率的な圧縮手法の開発
木構造文書の有している木構造及びテキストを同時に可逆圧縮する効率的な手法の提案および実装を行った。現在は、さらなる改良を行っている。
(3)グラフパターン照合アルゴリズムの設計
基礎研究として、正データからの有限和に関する多項式時間帰納推論可能性および質問学習について検討を行った。現在は、圧縮データを対象とした機械学習についての研究を行っている。
(4)グラフパターン発見手法への応用を目指した基礎研究
可逆圧縮されたグラフ構造データからのグラフパターン発見手法の開発時におさえておかなければならない諸問題を同定するための基礎研究を行った。

  • Research Products

    (3 results)

All 2005

All Journal Article (3 results)

  • [Journal Article] Polynomial Time Inductive Inference of TTSP Graph Languages from Positive Data2005

    • Author(s)
      R.Takami, Y.Suzuki, T.Uchida, T.Shoudai, Y.Nakamura
    • Journal Title

      Proc.15th International Conference on Inductive Logic Programming(ILP2005) 3625

      Pages: 366-383

  • [Journal Article] A Polynomial Time Matching Algorithm of Ordered Tree Patterns having Height-Constrained Variables2005

    • Author(s)
      K.Aikou, Y.Suzuki, T.Shoudai, T.Uchida, T.Miyahara
    • Journal Title

      Proc. 16th Annual Symposium on Combinatorial Pattern Matching(CPM2005) 3537

      Pages: 346-357

  • [Journal Article] Discovery of Maximally Frequent Tag Tree Patterns with Height-Constrained Variables from Semistructured Web Documents2005

    • Author(s)
      Y.Suzuki, T.Miyahara, T.Shoudai, T.Uchida, Y.Nakamura
    • Journal Title

      International Workshop on Challenges in Web Information Retrieval and Integration(WIRI 2005)

      Pages: 104-112

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi