• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

圧縮文字列上の高速パターン列挙に関する基盤技術開発

研究課題

研究課題/領域番号 12J06417
研究機関九州大学

研究代表者

井 智弘  九州大学, 大学院・システム情報科学研究院, 特別研究員(PD)

キーワード文字列パターン列挙 / 圧縮文字列処理
研究概要

平成24年度前半は,圧縮されていない文書集合の中に頻出する文字列パターンを高速に列挙する手法を開発した.提案手法は既存手法を内包する様々な同値関係における飽和パターンの列挙を可能にし,また,文字列処理の技術を援用してアルゴリズムの高速化を実現している.その成果をまとめた論文は,European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases(ECML-PKDD 2012)に採択され発表を行った.また,国内ではERATO湊離散構造処理系プロジェクト「2012年度初夏のワークショップ」にて発表を行っている.
平成24年度後半は,文法圧縮された文字列上で効率的に畳込み計算を行う手法を開発した.文字列の畳込みは,不一致を許す文字列照合やドントケア文字を含む文字列集合など様々な近似文字列照合に応用出来る重要な技術であり,本研究の成果は,文法圧縮を用いる事で畳込み計算の高速化を可能にするという画期的なものである.本研究成果をまとめた論文は,Data Compression Conference(DCC2013)に採択され発表を行った.
その他,接尾辞が束ねられた文字列集合に対してポジションヒープと呼ばれる索引構造を効率的に構築するアルゴリズムや,連長圧縮を用いてLempel-Ziv78分解を高速に計算するアルゴリズムなどを提案している.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度の研究で,文書集合中の頻出文字列パターン列挙と,文法圧縮された文字列上で近似文字列照合を効率的に行う手法に関する知見が得られた.これらは,本研究課題が目指す「圧縮文字列上で動作する列挙アルゴリズム」の基盤技術になると考えられる.

今後の研究の推進方策

文法圧縮された文字列上で繰り返し構造や回文などの特徴的な文字列を高速に列挙する手法の開発を行う.また,文法圧縮された文字列上でLyndon分解を効率的に計算する手法の開発を行う.

  • 研究成果

    (13件)

すべて 2013 2012

すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (7件)

  • [雑誌論文] From Run Length Encoding to LZ78 and Back Again2013

    • 著者名/発表者名
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the Data Compression Conference 20

      ページ: 143-152

    • 査読あり
  • [雑誌論文] Computing convolution on grammar-compressed text2013

    • 著者名/発表者名
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the Data Compression Conference 20

      ページ: 451-460

    • 査読あり
  • [雑誌論文] Inferring Strings from Suffix Trees and Links on a Binary Alphabet2013

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Journal of Discrete Applied Mathematics

      巻: (in press)

    • DOI

      10.1016/j.dam.2013.02.033

    • 査読あり
  • [雑誌論文] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • 著者名/発表者名
      Tomohiro I, Yuki Enokuna, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      In Proceedings of the European Conference on Machine Learning and Principles and Practice of knowledge Discovery in Databases

      巻: LNCS 7524 ページ: 435-450

    • DOI

      10.1007/978-3-642-33486-3_28

    • 査読あり
  • [雑誌論文] An efficient algorithm to test square-freeness of strings compressed by straight-line programs2012

    • 著者名/発表者名
      Hideo Bannai, Travis Gagie, Tomohiro I, Shunsuke Inenaga, Gad M. Landau, Moshe Lewenstein
    • 雑誌名

      Journal of Information Processing Letters

      巻: 112(19) ページ: 711-714

    • DOI

      10.1016/j.ipl.2012.06.017

    • 査読あり
  • [雑誌論文] The position heap of a trie2012

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      In Proceedings of the 19th Symposium on String Processing and Information Retrieval

      巻: LNCS 7608 ページ: 360-371

    • DOI

      10.1007/978-3-642-34109-0_38

    • 査読あり
  • [学会発表] Computing convolution on grammar-compressed text2013

    • 著者名/発表者名
      Toshiya Tanaka, Tomohiro I. Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      Data Compression Conference 2013 (DCC 2013)
    • 発表場所
      アメリカ・, スノーバード
    • 年月日
      2013-03-22
  • [学会発表] From Run Length Encoding to LZ78 and Back Again2013

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      Data Compression Conference 2013 (DCC 2013)
    • 発表場所
      アメリカ・, スノーバード
    • 年月日
      2013-03-20
  • [学会発表] The position heap of a trie2012

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      Synposiun on String Processing and Information Retrieval (SPIRE 2012)
    • 発表場所
      コロンビア, カルタヘナ
    • 年月日
      2012-10-23
  • [学会発表] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • 著者名/発表者名
      Tomohiro I, Yuki Enokuma, Hideo Bannai, Masayuki Takeda
    • 学会等名
      the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD 2012)
    • 発表場所
      イギリス, ブリストル
    • 年月日
      2012-09-25
  • [学会発表] 直線的プログラムで圧縮された文字列の非反復性検証アルゴリズム2012

    • 著者名/発表者名
      井智弘, 坂内英夫, 稲永俊介
    • 学会等名
      夏のLAシンポジウム2012
    • 発表場所
      京都, 天橋立
    • 年月日
      2012-07-19
  • [学会発表] 木構造で表現された複数文字列に対するポジションヒープ2012

    • 著者名/発表者名
      中島祐人, 井智弘, 稲永俊介, 坂内英夫, 竹田正幸
    • 学会等名
      夏のLAシンポジウム2012
    • 発表場所
      京都, 天橋立
    • 年月日
      2012-07-17
  • [学会発表] General Algorithms for Mining Closed Flexible Patterns under Various Equivalence Relations2012

    • 著者名/発表者名
      井智弘, 荏隈勇樹, 坂内英夫, 竹田正幸
    • 学会等名
      ERATO湊離散構造処理系プロジェクト「2012年度 初夏のワークショップ」
    • 発表場所
      北海道, 札幌
    • 年月日
      2012-06-23

URL: 

公開日: 2014-07-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi