• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

グラフの局所的構造に基づく大規模半構造データからの高速パターン発見

研究課題

研究課題/領域番号 20700143
研究機関九州工業大学

研究代表者

坂本 比呂志  九州工業大学, 大学院・情報工学研究院, 准教授 (50315123)

キーワード情報抽出 / カーネル法 / パターン発見 / 距離計算 / 圧縮文字列照合 / アルゴリズム
研究概要

本研究は, 従来手法では取り扱いが極めて困難な規模の半構造データから, 特徴的なパターンを高速に発見するスケーラブルなマイニング技術を実現する. この目的を達成するために, 情報処理技術(畳み込みカーネル, XML索引, データ圧縮アルゴリズム)を援用し, グラフ構造からのパターン発見のボトルネックである, 部分グラフ同型判定を回避しつも高い精度でのパターン発見を行う. 本年度の研究成果を以下にまとめる.
ML索引による構造間の距離計算 : 抽出した局所構造がどのように結合してグラフに埋め込まれているかを計算することは, 部分グラフ同型問題と等価である. そこで, 局所構造間の距離が高速に計算できれば, それらのグラフ上における大まかな配置を求めることが出来る. したがって, それらのうち互いに近いもの同士がパターンを形成していることが予測できる. 本研究では, グラフ上の接続関係を判定するアルゴリズムを, 接点間の距離が計算できるものへと改良してこの問題を解決した. 圧縮文字列照合によるパターンの類似性判定:グラフ構造だけではなくテキストや属性値の類似性にも着目して特徴パターンの抽出精度を向上させた. 同じ構造を持つパターン内の属性値などは, 値は異なるもののその書式は似通っていると考えられる. このような仮定から, あらかじめ属性やテキスト部分を圧縮保存しておき, 必要に応じてその類似性を計算する手法を開発した.
これらの技術を応用して, 次年度以降で, 関連技術を発展させて目的のパターンを抽出するシステムを完成する.

  • 研究成果

    (5件)

すべて 2009 2008

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件)

  • [雑誌論文] A Space-Saving Approximation Algorithm for Grammar-Based Compression2009

    • 著者名/発表者名
      Hiroshi Sakamoto, Shirou Maruyama, Takuya Kida, Shinichi Shimozono
    • 雑誌名

      IEICE Trans. on Information and Systems E92-D

      ページ: 158-165

    • 査読あり
  • [雑誌論文] 有向グラフ上の到達可能性のための索引構造と大規模XMLデータベースへの応用2008

    • 著者名/発表者名
      中村有作, 原口新平, 舞田哲哉, 坂本比呂志
    • 雑誌名

      電子情報通信学会論文誌 J91-D

      ページ: 2217-2224

    • 査読あり
  • [雑誌論文] 有向グラフ上の最短経路問題に対する効率的な索引付け2008

    • 著者名/発表者名
      原口新平, 中村有作, 坂本比呂志
    • 雑誌名

      日本データベース学会論文誌 7

      ページ: 211-214

    • 査読あり
  • [学会発表] Context-Sensitive Grammar Transform : Compression and Pattern Matching2008

    • 著者名/発表者名
      Shirou Maruyama, Youhei. Tanaka, Hiroshi. Sakamoto. Masayuki. Takeda
    • 学会等名
      Proc. 15th String Processing and Informati on Retrieval Symposium
    • 発表場所
      メルボルン(オーストラリア)
    • 年月日
      2008-11-10
  • [学会発表] Move as Multi-Dominance and Graph-Theoretical Linearization2008

    • 著者名/発表者名
      Takashi Toyoshima, Hiorshi Sakamoto
    • 学会等名
      Proc. 3rd Brussels Conference on Generatiye Linguistics
    • 発表場所
      ブリュッセル(ベルギー)
    • 年月日
      2008-05-22

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi