• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

グラフの局所的構造に基づく大規模半構造データからの高速パターン発見

Research Project

Project/Area Number 20700143
Research InstitutionKyushu Institute of Technology

Principal Investigator

坂本 比呂志  九州工業大学, 大学院・情報工学研究院, 准教授 (50315123)

Keywords情報抽出 / カーネル法 / パターン発見 / 距離計算 / 圧縮文字列照合 / アルゴリズム
Research Abstract

本研究は,従来手法では取り扱いが極めて困難な規模の半構造データから,特徴的なパターンを高速に発見するスケーラブルなマイニング技術を実現する.この目的を達成するために,情報処理技術(畳み込みカーネル,XML索引,データ圧縮アルゴリズム)を援用し,グラフ構造からのパターン発見のボトルネックである,部分グラフ同型判定を回避しつも高い精度でのパターン発見を行う,最終年度は,昨年度に引き続き以下の項目を達成するためのプログラムを完成させた.
(A)畳み込みカーネルによる局所構造抽出:前年度に開発した,省メモリ化を達成するための不要パターンをあらかじめ取り除く前処理手法をグラフ構造上で実装した.
(B)XML索引による構造間の距離計算:データを分割することで,大規模XMLデータに対する高速索引付けを可能とした.また,ノード間の距離計算手法を改良し局所構造間距離計算を実現した.これらの性能をデータ分割の手法をPCクラスタ上で実装し,その性能を確認した.
(C)圧縮文字列照合によるパターンの類似性判定:XMLデータは頻繁にデータの更新が起こるため,データの変更に対して影響が少ない圧縮法が望ましい.そこで,前年度までに開発した適応型圧縮アルゴリズムを大規模データに適用し,規模耐性が高いことを確認した.
以上のように,最新のプログラムをPCクラスタ等の分散システム上で実装し,本研究の成果を国際会議や論文誌,国内研究会等で公表した.今後は,家庭用PCなどの環境で動作するより軽量なアルゴリズムを開発していく.

  • Research Products

    (12 results)

All 2011 2010 Other

All Journal Article (2 results) (of which Peer Reviewed: 1 results) Presentation (9 results) Remarks (1 results)

  • [Journal Article] データ圧縮による大規模情報検索の実現と関連情報マイニングへの応用-テキストの特徴をつかまえる圧縮技術-2010

    • Author(s)
      丸山史郎, 坂本比呂志
    • Journal Title

      情報管理

      Volume: 53(5) Pages: 233-240

  • [Journal Article] Extracting Research Communities from Bibliographic Data

    • Author(s)
      Yushi Nakamura, Toshihiko Horiike, Tetsuji Kuboyama, Hiroshi Sakamoto
    • Journal Title

      KES Journal

      Volume: (印刷中)

    • Peer Reviewed
  • [Presentation] 文法型圧縮法の全二分木表現による符号化とランダムアクセス手法の提案2011

    • Author(s)
      丸山史郎, 馬場雅大, 岸上直也, 坂本比呂志
    • Organizer
      第134回アルゴリズム研究会
    • Year and Date
      20110000
  • [Presentation] 関連語の自動選定による論文コミュニティ抽出技術の改良2011

    • Author(s)
      中村優士, 堀池寿彦, 久保山哲二, 坂本比呂志
    • Organizer
      第81回SIG-FPAI研究会
    • Year and Date
      20110000
  • [Presentation] 長い部分文字列を検索するための文法圧縮索引2011

    • Author(s)
      坂本比呂志, 岸上直也, 中原昌也, 丸山史郎
    • Organizer
      2011年冬のLAシンポジウム
    • Year and Date
      20110000
  • [Presentation] 文法圧縮に基づいた圧縮データの自己索引構造化の提案2011

    • Author(s)
      馬場雅大, 丸山史郎, 坂本比呂志, 定兼邦彦, 山下雅史
    • Organizer
      2011年冬のLAシンポジウム
    • Year and Date
      20110000
  • [Presentation] 長いパターンを検出するための文法圧縮に基づく索引構造2011

    • Author(s)
      岸上直也, 中原昌哉, 丸山史郎, 坂本比呂志
    • Organizer
      第133回アルゴリズム研究会
    • Year and Date
      20110000
  • [Presentation] Predicting Mutation Trend of Influenza A Virus through Dimensionality Reduction in Hamming Metric on HA Amino Acid Sequences2011

    • Author(s)
      T.Kuboyama, K.Ito, K.Hirata, H.Sakamoto
    • Organizer
      Annual International Conference on Bioinformatics and Computational Biology
    • Place of Presentation
      シンガポール
    • Year and Date
      2011-02-28
  • [Presentation] 検索可能な文法圧縮の実現-文字列間類似度の高速計算-2010

    • Author(s)
      坂本比呂志
    • Organizer
      FIT2010イベント企画ScienceとEngineeringをつなぐ『Art』を求めて-ERATO湊離散構造処理系プロジェクトシンポジウム-ポスターセッション
    • Place of Presentation
      九州大学
    • Year and Date
      2010-09-08
  • [Presentation] Edit Sensitive Parsingを用いた文法圧縮に基づく省スペースな索引構造-理論編-2010

    • Author(s)
      馬場雅大, 丸山史郎, 坂本比呂志, 小野廣隆, 定兼邦彦, 山下雅史
    • Organizer
      人工知能学会第78回SIG-FPAI研究会
    • Place of Presentation
      北海道大学
    • Year and Date
      2010-08-01
  • [Presentation] Edit Sensitive Parsingを用いた文法圧縮に基づく省スペースな索引構造-実験による評価-2010

    • Author(s)
      丸山史郎, 馬場雅大, 坂本比呂志, 小野廣隆, 定兼邦彦, 山下雅史
    • Organizer
      人工知能学会第78回SIG-FPAI研究会
    • Place of Presentation
      北海道大学
    • Year and Date
      2010-08-01
  • [Remarks]

    • URL

      http://www.donald.ai.kyutech.ac.jp/~hiroshi/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi