• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

グラフの局所的構造に基づく大規模半構造データからの高速パターン発見

Research Project

Project/Area Number 20700143
Research InstitutionKyushu Institute of Technology

Principal Investigator

坂本 比呂志  Kyushu Institute of Technology, 大学院・情報工学研究院, 准教授 (50315123)

Keywords情報抽出 / カーネル法 / パターン発見 / 距離計算 / 圧縮文字列照合 / アルゴリズム
Research Abstract

本研究は, 従来手法では取り扱いが極めて困難な規模の半構造データから, 特徴的なパターンを高速に発見するスケーラブルなマイニング技術を実現する. この目的を達成するために, 情報処理技術(畳み込みカーネル, XML索引, データ圧縮アルゴリズム)を援用し, グラフ構造からのパターン発見のボトルネックである, 部分グラフ同型判定を回避しつも高い精度でのパターン発見を行う. 本年度の研究成果を以下にまとめる.
ML索引による構造間の距離計算 : 抽出した局所構造がどのように結合してグラフに埋め込まれているかを計算することは, 部分グラフ同型問題と等価である. そこで, 局所構造間の距離が高速に計算できれば, それらのグラフ上における大まかな配置を求めることが出来る. したがって, それらのうち互いに近いもの同士がパターンを形成していることが予測できる. 本研究では, グラフ上の接続関係を判定するアルゴリズムを, 接点間の距離が計算できるものへと改良してこの問題を解決した. 圧縮文字列照合によるパターンの類似性判定:グラフ構造だけではなくテキストや属性値の類似性にも着目して特徴パターンの抽出精度を向上させた. 同じ構造を持つパターン内の属性値などは, 値は異なるもののその書式は似通っていると考えられる. このような仮定から, あらかじめ属性やテキスト部分を圧縮保存しておき, 必要に応じてその類似性を計算する手法を開発した.
これらの技術を応用して, 次年度以降で, 関連技術を発展させて目的のパターンを抽出するシステムを完成する.

  • Research Products

    (5 results)

All 2009 2008

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (2 results)

  • [Journal Article] A Space-Saving Approximation Algorithm for Grammar-Based Compression2009

    • Author(s)
      Hiroshi Sakamoto, Shirou Maruyama, Takuya Kida, Shinichi Shimozono
    • Journal Title

      IEICE Trans. on Information and Systems E92-D

      Pages: 158-165

    • Peer Reviewed
  • [Journal Article] 有向グラフ上の到達可能性のための索引構造と大規模XMLデータベースへの応用2008

    • Author(s)
      中村有作, 原口新平, 舞田哲哉, 坂本比呂志
    • Journal Title

      電子情報通信学会論文誌 J91-D

      Pages: 2217-2224

    • Peer Reviewed
  • [Journal Article] 有向グラフ上の最短経路問題に対する効率的な索引付け2008

    • Author(s)
      原口新平, 中村有作, 坂本比呂志
    • Journal Title

      日本データベース学会論文誌 7

      Pages: 211-214

    • Peer Reviewed
  • [Presentation] Context-Sensitive Grammar Transform : Compression and Pattern Matching2008

    • Author(s)
      Shirou Maruyama, Youhei. Tanaka, Hiroshi. Sakamoto. Masayuki. Takeda
    • Organizer
      Proc. 15th String Processing and Informati on Retrieval Symposium
    • Place of Presentation
      メルボルン(オーストラリア)
    • Year and Date
      2008-11-10
  • [Presentation] Move as Multi-Dominance and Graph-Theoretical Linearization2008

    • Author(s)
      Takashi Toyoshima, Hiorshi Sakamoto
    • Organizer
      Proc. 3rd Brussels Conference on Generatiye Linguistics
    • Place of Presentation
      ブリュッセル(ベルギー)
    • Year and Date
      2008-05-22

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi