• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

圧縮文字列上の高速パターン列挙に関する基盤技術開発

Research Project

Project/Area Number 12J06417
Research InstitutionKyushu University

Principal Investigator

井 智弘  九州大学, 大学院・システム情報科学研究院, 特別研究員(PD)

Keywords文字列パターン列挙 / 圧縮文字列処理
Research Abstract

平成24年度前半は,圧縮されていない文書集合の中に頻出する文字列パターンを高速に列挙する手法を開発した.提案手法は既存手法を内包する様々な同値関係における飽和パターンの列挙を可能にし,また,文字列処理の技術を援用してアルゴリズムの高速化を実現している.その成果をまとめた論文は,European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases(ECML-PKDD 2012)に採択され発表を行った.また,国内ではERATO湊離散構造処理系プロジェクト「2012年度初夏のワークショップ」にて発表を行っている.
平成24年度後半は,文法圧縮された文字列上で効率的に畳込み計算を行う手法を開発した.文字列の畳込みは,不一致を許す文字列照合やドントケア文字を含む文字列集合など様々な近似文字列照合に応用出来る重要な技術であり,本研究の成果は,文法圧縮を用いる事で畳込み計算の高速化を可能にするという画期的なものである.本研究成果をまとめた論文は,Data Compression Conference(DCC2013)に採択され発表を行った.
その他,接尾辞が束ねられた文字列集合に対してポジションヒープと呼ばれる索引構造を効率的に構築するアルゴリズムや,連長圧縮を用いてLempel-Ziv78分解を高速に計算するアルゴリズムなどを提案している.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度の研究で,文書集合中の頻出文字列パターン列挙と,文法圧縮された文字列上で近似文字列照合を効率的に行う手法に関する知見が得られた.これらは,本研究課題が目指す「圧縮文字列上で動作する列挙アルゴリズム」の基盤技術になると考えられる.

Strategy for Future Research Activity

文法圧縮された文字列上で繰り返し構造や回文などの特徴的な文字列を高速に列挙する手法の開発を行う.また,文法圧縮された文字列上でLyndon分解を効率的に計算する手法の開発を行う.

  • Research Products

    (13 results)

All 2013 2012

All Journal Article (6 results) (of which Peer Reviewed: 6 results) Presentation (7 results)

  • [Journal Article] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the Data Compression Conference 20

      Pages: 143-152

    • Peer Reviewed
  • [Journal Article] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the Data Compression Conference 20

      Pages: 451-460

    • Peer Reviewed
  • [Journal Article] Inferring Strings from Suffix Trees and Links on a Binary Alphabet2013

    • Author(s)
      Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Journal of Discrete Applied Mathematics

      Volume: (in press)

    • DOI

      10.1016/j.dam.2013.02.033

    • Peer Reviewed
  • [Journal Article] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • Author(s)
      Tomohiro I, Yuki Enokuna, Hideo Bannai, Masayuki Takeda
    • Journal Title

      In Proceedings of the European Conference on Machine Learning and Principles and Practice of knowledge Discovery in Databases

      Volume: LNCS 7524 Pages: 435-450

    • DOI

      10.1007/978-3-642-33486-3_28

    • Peer Reviewed
  • [Journal Article] An efficient algorithm to test square-freeness of strings compressed by straight-line programs2012

    • Author(s)
      Hideo Bannai, Travis Gagie, Tomohiro I, Shunsuke Inenaga, Gad M. Landau, Moshe Lewenstein
    • Journal Title

      Journal of Information Processing Letters

      Volume: 112(19) Pages: 711-714

    • DOI

      10.1016/j.ipl.2012.06.017

    • Peer Reviewed
  • [Journal Article] The position heap of a trie2012

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      In Proceedings of the 19th Symposium on String Processing and Information Retrieval

      Volume: LNCS 7608 Pages: 360-371

    • DOI

      10.1007/978-3-642-34109-0_38

    • Peer Reviewed
  • [Presentation] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I. Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      アメリカ・, スノーバード
    • Year and Date
      2013-03-22
  • [Presentation] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      アメリカ・, スノーバード
    • Year and Date
      2013-03-20
  • [Presentation] The position heap of a trie2012

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      Synposiun on String Processing and Information Retrieval (SPIRE 2012)
    • Place of Presentation
      コロンビア, カルタヘナ
    • Year and Date
      2012-10-23
  • [Presentation] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • Author(s)
      Tomohiro I, Yuki Enokuma, Hideo Bannai, Masayuki Takeda
    • Organizer
      the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD 2012)
    • Place of Presentation
      イギリス, ブリストル
    • Year and Date
      2012-09-25
  • [Presentation] 直線的プログラムで圧縮された文字列の非反復性検証アルゴリズム2012

    • Author(s)
      井智弘, 坂内英夫, 稲永俊介
    • Organizer
      夏のLAシンポジウム2012
    • Place of Presentation
      京都, 天橋立
    • Year and Date
      2012-07-19
  • [Presentation] 木構造で表現された複数文字列に対するポジションヒープ2012

    • Author(s)
      中島祐人, 井智弘, 稲永俊介, 坂内英夫, 竹田正幸
    • Organizer
      夏のLAシンポジウム2012
    • Place of Presentation
      京都, 天橋立
    • Year and Date
      2012-07-17
  • [Presentation] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • Author(s)
      井智弘, 荏隈勇樹, 坂内英夫, 竹田正幸
    • Organizer
      ERATO湊離散構造処理系プロジェクト「2012年度 初夏のワークショップ」
    • Place of Presentation
      北海道, 札幌
    • Year and Date
      2012-06-23

URL: 

Published: 2014-07-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi