• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

幾何構造データからの効率的なデータマイニングシステム

研究課題

研究課題/領域番号 14780303
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関広島市立大学

研究代表者

内田 智之  広島市立大学, 情報科学部, 助教授 (70264934)

研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2004年度: 800千円 (直接経費: 800千円)
2003年度: 600千円 (直接経費: 600千円)
2002年度: 2,100千円 (直接経費: 2,100千円)
キーワード可逆的圧縮 / 幾何構造データ / 発見的手法 / 構造パターン / データマイニングシステム
研究概要

1)幾何構造データの圧縮手法の効率化:
本年度は、これまでに得られた知見をもとに、幾何構造データに対するより効率のよい圧縮手法の開発および電気配線図面の実データや巨大な人工データを用いた評価実験を行い、その有効性を示し、国際会議(ASGIS2004)で発表を行った。この手法は、、同型な部分グラフを変数に置き換え、その置き換え規則を代入という概念を用いることにより、可逆性を保ちかつ構造を保持しながら表現グラフのノード数の削減を行うというものである。
2)圧縮グラフデータ上のパターン照合アルゴリズムの開発および実装:
このパターン照合アルゴリズムの高速化は、本研究で作成を目指すデータマイニングシステム全体の効率性に大きく影響を与えるものである。Tを木構造文書とし、tを項木とする。Tを圧縮して得られる項木fと代入θが与えられたとき、tの変数に適当な木を代入することでTと同系な木fθを作り出すことができるか否かを判定するパターン照合問題を解くパターン照合分散アルゴリズムの設計を行い、現在そのプロトタイプを作成中である。今後、この分散アルゴリズムの有効性を確かめるため評価実験を行い、国際会議に投稿する予定である。
本研究の基本コンセプトにおいて、構造的な特徴を保持しつつ頻出する部分構造を変数に置換えるため、可逆的なノード数の削減が可能であり、さらにデータマイニングシステム全体の自明でない分散化に対する指針を与えることができ、PCクラスタを用いることにより、より高速なデータマイニング手法の設計が可能であるという知見を得た。この知見をもとに、さらなる拡張を行い、本研究課題をより発展させていく予定である。本年はまとめの年であり、本研究課題の成果の一部は国際会議で公表することができたが、数件の論文は受理されなかったため、これら論文の公表も今後行う予定である。

報告書

(3件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (14件)

すべて 2004 その他

すべて 雑誌論文 (3件) 文献書誌 (11件)

  • [雑誌論文] Extracting Multiple Layers from Data Having Graph Structures2004

    • 著者名/発表者名
      Y.Itokawa, T.Uchida, Y.Nakamura
    • 雑誌名

      Journal of Chongqing University of Posts and Telecommunications Vol.16,No.5

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Frequent Structural Features among Words in Tree-Structured Documents2004

    • 著者名/発表者名
      T.Uchida, T.Mogawa, Y.Nakamura
    • 雑誌名

      Proc.8th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2004) LNAI 3056

      ページ: 341-350

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Discovery of Maximally Frequent Tag Tree Patterns with Contractible Variables from Semistructured Documents2004

    • 著者名/発表者名
      T.Miyahara, Y.Suzuki, T.Shoudai, T.Uchida, et al.
    • 雑誌名

      Proc.8th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2004) LNAI 3056

      ページ: 133-144

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] T.Uchida, T.Mogawa, Y.Nakamura: "Finding Frequent Structural Features among Words in Tree-Structured Documents"Proc.PAKDD 2004. (発表予定).

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 中田, 佐野, 内田ら: "グラフ合成に基づく監視制御システムソフトウェアの生成"電気学会論文誌(C). Vol.124,No.1. 196-203 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Y.Suzuki, T.Shoudai, T.Uchida et al.: "Efficient Learning of Ordered and Unordered Tree Patterns with Contractible Variables"Proc.ALT 2003(LNAI 2842). 114-128 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] K.Yamagata, T.Uchida, T.Shoudai, Y.Nakamura: "An Effective Grammar-Based Compression Algorithm for Tree Structured Data"Proc.ILP2003(LNAI 2835). 383-400 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Y.Itokawa, T.Uchida, T.Shoudai, et al.: "Finding Frequent Subgraphs from Graph Structured Data with Geometric Information and Its Application to Lossless Compression"Proc.PAKDD2003(LNAI 2637). 582-594 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Y.Itokawa, T.Uchida, et al.: "Finding Frequent Subgraphs from Graph Structured Data with Geometric Information and Its Application to Lossless Compression"Proc. PAKDD 2003. (発表予定).

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 糸川裕子, 内田智之, 正代隆義, 宮原哲浩, 中村泰明: "グラフパターンを用いた幾何構造データの可逆的な圧縮手法"人工知能学会研究会資料(SIG-FAI-A202-13). 73-78 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Y.Suzuki, T.Shoudai, T.Miyahara, T.Uchida: "Ordered Term Tree Languages Which Are Polynomial Time Inductively Inferable from Positive Data"Proc. ALT 2002 (LNAI 2533). 188-202 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Y.Suzuki, T.Uchida, et al.: "Polynomial Time Inductive Inference of Ordered Tree Patterns with Internal Structured Variables from Positive Data"Proc. COLT 2002 (LNAI 2375). 169-184 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] K.Furukawa, T.Uchida, et al.: "Extracting Characteristic Structures among Words in Semistructured Documents"Proc. PAKDD 2002 (LNAI 2336). 356-367 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] T.Miyahara, T.Uchida, et al.: "Discovery of Frequent Tag Tree Patterns in Semistructured Web Documents"Proc. PAKDD 2002 (LNAI 2336). 341-355 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi