• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

データ圧縮に基づく高速パラメタ化文字列照合技法の開発

研究課題

研究課題/領域番号 23700022
研究機関九州大学

研究代表者

稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)

キーワードアルゴリズム / 文字列処理 / データ圧縮
研究概要

文字列とは,記号の連鎖のことである.コンピュータ上で取り扱うデータの多くは,文字列とみなすことができる.そのため,文字列データを高速かつ省領域で処理する基盤技術の開発は,情報爆発時代における喫緊の課題となっている.
近年,爆発的に増加した非構造データの集まりを俗にビッグデータと呼ぶようになり,ビッグデータの省領域な格納方法,および有効な活用方法の開発に注目が集まっている.本研究では,データに内在する冗長性を削除し,データの記述長を短縮するデータ圧縮技術を活用する.特に,直線的プログラム(Straight Line Program, SLP)と呼ばれる,単一の文字列のみを導出するチョムスキー標準形の文脈自由文法でデータを圧縮表現する方法に着目した.SLP のサイズを n としたとき,展開文字列長が n に対して指数的に大きくなる場合が存在する.したがって,入力 SLP を陽に展開することなく,様々な処理を n の多項式時間で行うアルゴリズムは,大規模データの省領域な格納と,高速な検索・知識発見に有用である.
今年度は主に,以下の高度な処理を入力 SLP サイズ n の多項式時間で行う手法を開発した.(1) SLP 圧縮文字列が反復文字列(squares)を含むかどうかの判定,(2) SLP 圧縮文字列から LZ78 分解への変換,(3) SLP 圧縮文字列と非圧縮パターンの畳み込みの計算,(4) SLP 圧縮文字列中の全 q グラムの出現頻度の計算.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

H23年度は,回文照合問題という新たな問題を提案し,それを最適時間で解くアルゴリズムを開発した.また,パラメタ化文字列照合との密接な関係性を明らかにした.また,H24年度には,研究実績の概要の欄でも述べたとおり,SLP で圧縮表現された文字列に対して,様々な処理を高速かつ省領域で行う技術の開発に立て続けに成功しており,当初の計画を上回るものとなっている.

今後の研究の推進方策

今後は,研究実績の概要で述べたアルゴリズムのさらなる高速化・省領域化に取り組む.また,より高度な処理を行うことができるように改良を重ねていく予定である.

次年度の研究費の使用計画

提案手法のさらなる高速化・省領域化の実現ために,当該分野の第一線で活躍する研究者が集う会議に積極的に参加し,最新の研究成果を網羅するとともに,新技術開発のためのディスカッションを行う.このため,国際会議参加や研究打ち合わせを目的として,数度の海外出張を予定している.また,東北大学の共同研究グループとの研究打ち合わせや,国内の会議への参加も積極的に行う予定である.研究成果をまとめるために,計算機や周辺機器の購入も適宜行う予定である.

  • 研究成果

    (16件)

すべて 2013 2012 その他

すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (6件) 備考 (2件)

  • [雑誌論文] Permuted Pattern Matching on Multi-Track Strings2013

    • 著者名/発表者名
      Takashi Katsura, Kazuyuki Narisawa, Ayumi Shinohara, Hideo Bannai, and Shunsuke Inenaga
    • 雑誌名

      In Proc. The 39th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2013), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7741 ページ: 280-291

    • DOI

      10.1007/978-3-642-35843-2_25

    • 査読あり
  • [雑誌論文] Fast q-gram mining on SLP compressed strings2013

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga and Masayuki Takeda
    • 雑誌名

      Journal of Discrete Algorithms

      巻: 18 ページ: 89-99

    • DOI

      10.1016/j.jda.2012.07.006

    • 査読あり
  • [雑誌論文] Computing convolution on grammar-compressed text2013

    • 著者名/発表者名
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      Proc. Data Compression Conference 2013 (DCC 2013)

      ページ: 451-460

    • 査読あり
  • [雑誌論文] From Run Length Encoding to LZ78 and Back Again2013

    • 著者名/発表者名
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      Proc. Data Compression Conference 2013 (DCC 2013)

      ページ: 143-152

    • 査読あり
  • [雑誌論文] An efficient algorithm to test square-freeness of strings compressed by straight-line programs2012

    • 著者名/発表者名
      Hideo Bannai, Travis Gagie, Tomohiro I, Shunsuke Inenaga, Gad M. Landau, and Moshe Lewenstein
    • 雑誌名

      Information Processing Letters

      巻: 122(9) ページ: 711-714

    • DOI

      10.1016/j.ipl.2012.06.017

    • 査読あり
  • [雑誌論文] The Position Heap of a Trie2012

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      In Proc. the 19th Symposium on String Processing and Information Retrieval (SPIRE 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7608 ページ: 360-371

    • DOI

      10.1007/978-3-642-34109-0_38

    • 査読あり
  • [雑誌論文] Efficient LZ78 Factorization of Grammar Compressed Text2012

    • 著者名/発表者名
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 雑誌名

      In Proc. the 19th Symposium on String Processing and Information Retrieval (SPIRE 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7608 ページ: 86-98

    • DOI

      10.1007/978-3-642-34109-0_10

    • 査読あり
  • [雑誌論文] Speeding-up q-gram mining on grammar-based compressed texts2012

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 雑誌名

      In Proc. the 23rd Annual Symposium on Combinatorial Pattern Matching (CPM 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7354 ページ: 220-231

    • DOI

      10.1007/978-3-642-31265-6_18

    • 査読あり
  • [学会発表] Computing convolution on grammar-compressed text2013

    • 著者名/発表者名
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      Data Compression Conference 2013 (DCC 2013)
    • 発表場所
      Snowbird, Utah
    • 年月日
      20130320-20130322
  • [学会発表] From Run Length Encoding to LZ78 and Back Again2013

    • 著者名/発表者名
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      Data Compression Conference 2013 (DCC 2013)
    • 発表場所
      Snowbird, Utah
    • 年月日
      20130320-20130320
  • [学会発表] Permuted Pattern Matching on Multi-Track Strings2013

    • 著者名/発表者名
      Takashi Katsura, Kazuyuki Narisawa, Ayumi Shinohara, Hideo Bannai, and Shunsuke Inenaga
    • 学会等名
      39th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2013)
    • 発表場所
      Spindleruv Mlyn, Czech Republic
    • 年月日
      20130126-31
  • [学会発表] The Position Heap of a Trie2012

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      19th Symposium on String Processing and Information Retrieval (SPIRE 2012)
    • 発表場所
      Cartagena de Indias, Colombia
    • 年月日
      20121021-20121025
  • [学会発表] Efficient LZ78 Factorization of Grammar Compressed Text2012

    • 著者名/発表者名
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 学会等名
      19th Symposium on String Processing and Information Retrieval (SPIRE 2012)
    • 発表場所
      Cartagena de Indias, Colombia
    • 年月日
      20121021-20121025
  • [学会発表] Speeding-up q-gram mining on grammar-based compressed texts2012

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 学会等名
      23rd Annual Symposium on Combinatorial Pattern Matching (CPM 2012)
    • 発表場所
      Helsinki, Finland
    • 年月日
      20120703-05
  • [備考] 研究者ホームページ

    • URL

      http://str.i.kyushu-u.ac.jp/~inenaga/index-j.html

  • [備考] 九州大学研究者情報

    • URL

      http://hyoka.ofc.kyushu-u.ac.jp/search/details/K003385/index.html

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi