• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

幾何構造データからの効率的なデータマイニングシステム

Research Project

Project/Area Number 14780303
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionHiroshima City University

Principal Investigator

内田 智之  広島市立大学, 情報科学部, 助教授 (70264934)

Project Period (FY) 2002 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2004: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2003: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2002: ¥2,100,000 (Direct Cost: ¥2,100,000)
Keywords可逆的圧縮 / 幾何構造データ / 発見的手法 / 構造パターン / データマイニングシステム
Research Abstract

1)幾何構造データの圧縮手法の効率化:
本年度は、これまでに得られた知見をもとに、幾何構造データに対するより効率のよい圧縮手法の開発および電気配線図面の実データや巨大な人工データを用いた評価実験を行い、その有効性を示し、国際会議(ASGIS2004)で発表を行った。この手法は、、同型な部分グラフを変数に置き換え、その置き換え規則を代入という概念を用いることにより、可逆性を保ちかつ構造を保持しながら表現グラフのノード数の削減を行うというものである。
2)圧縮グラフデータ上のパターン照合アルゴリズムの開発および実装:
このパターン照合アルゴリズムの高速化は、本研究で作成を目指すデータマイニングシステム全体の効率性に大きく影響を与えるものである。Tを木構造文書とし、tを項木とする。Tを圧縮して得られる項木fと代入θが与えられたとき、tの変数に適当な木を代入することでTと同系な木fθを作り出すことができるか否かを判定するパターン照合問題を解くパターン照合分散アルゴリズムの設計を行い、現在そのプロトタイプを作成中である。今後、この分散アルゴリズムの有効性を確かめるため評価実験を行い、国際会議に投稿する予定である。
本研究の基本コンセプトにおいて、構造的な特徴を保持しつつ頻出する部分構造を変数に置換えるため、可逆的なノード数の削減が可能であり、さらにデータマイニングシステム全体の自明でない分散化に対する指針を与えることができ、PCクラスタを用いることにより、より高速なデータマイニング手法の設計が可能であるという知見を得た。この知見をもとに、さらなる拡張を行い、本研究課題をより発展させていく予定である。本年はまとめの年であり、本研究課題の成果の一部は国際会議で公表することができたが、数件の論文は受理されなかったため、これら論文の公表も今後行う予定である。

Report

(3 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • Research Products

    (14 results)

All 2004 Other

All Journal Article (3 results) Publications (11 results)

  • [Journal Article] Extracting Multiple Layers from Data Having Graph Structures2004

    • Author(s)
      Y.Itokawa, T.Uchida, Y.Nakamura
    • Journal Title

      Journal of Chongqing University of Posts and Telecommunications Vol.16,No.5

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Finding Frequent Structural Features among Words in Tree-Structured Documents2004

    • Author(s)
      T.Uchida, T.Mogawa, Y.Nakamura
    • Journal Title

      Proc.8th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2004) LNAI 3056

      Pages: 341-350

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Discovery of Maximally Frequent Tag Tree Patterns with Contractible Variables from Semistructured Documents2004

    • Author(s)
      T.Miyahara, Y.Suzuki, T.Shoudai, T.Uchida, et al.
    • Journal Title

      Proc.8th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2004) LNAI 3056

      Pages: 133-144

    • Related Report
      2004 Annual Research Report
  • [Publications] T.Uchida, T.Mogawa, Y.Nakamura: "Finding Frequent Structural Features among Words in Tree-Structured Documents"Proc.PAKDD 2004. (発表予定).

    • Related Report
      2003 Annual Research Report
  • [Publications] 中田, 佐野, 内田ら: "グラフ合成に基づく監視制御システムソフトウェアの生成"電気学会論文誌(C). Vol.124,No.1. 196-203 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Y.Suzuki, T.Shoudai, T.Uchida et al.: "Efficient Learning of Ordered and Unordered Tree Patterns with Contractible Variables"Proc.ALT 2003(LNAI 2842). 114-128 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] K.Yamagata, T.Uchida, T.Shoudai, Y.Nakamura: "An Effective Grammar-Based Compression Algorithm for Tree Structured Data"Proc.ILP2003(LNAI 2835). 383-400 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Y.Itokawa, T.Uchida, T.Shoudai, et al.: "Finding Frequent Subgraphs from Graph Structured Data with Geometric Information and Its Application to Lossless Compression"Proc.PAKDD2003(LNAI 2637). 582-594 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Y.Itokawa, T.Uchida, et al.: "Finding Frequent Subgraphs from Graph Structured Data with Geometric Information and Its Application to Lossless Compression"Proc. PAKDD 2003. (発表予定).

    • Related Report
      2002 Annual Research Report
  • [Publications] 糸川裕子, 内田智之, 正代隆義, 宮原哲浩, 中村泰明: "グラフパターンを用いた幾何構造データの可逆的な圧縮手法"人工知能学会研究会資料(SIG-FAI-A202-13). 73-78 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Y.Suzuki, T.Shoudai, T.Miyahara, T.Uchida: "Ordered Term Tree Languages Which Are Polynomial Time Inductively Inferable from Positive Data"Proc. ALT 2002 (LNAI 2533). 188-202 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] Y.Suzuki, T.Uchida, et al.: "Polynomial Time Inductive Inference of Ordered Tree Patterns with Internal Structured Variables from Positive Data"Proc. COLT 2002 (LNAI 2375). 169-184 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] K.Furukawa, T.Uchida, et al.: "Extracting Characteristic Structures among Words in Semistructured Documents"Proc. PAKDD 2002 (LNAI 2336). 356-367 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] T.Miyahara, T.Uchida, et al.: "Discovery of Frequent Tag Tree Patterns in Semistructured Web Documents"Proc. PAKDD 2002 (LNAI 2336). 341-355 (2002)

    • Related Report
      2002 Annual Research Report

URL: 

Published: 2002-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi