• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実施状況報告書

データ圧縮に基づく高速パラメタ化文字列照合技法の開発

研究課題

研究課題/領域番号 23700022
研究機関九州大学

研究代表者

稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)

研究期間 (年度) 2011-04-28 – 2014-03-31
キーワード文字列情報処理 / アルゴリズム / データ構造
研究概要

文字列とは,記号の連鎖のことである.コンピュータ上で取り扱うデータの多くは,文字列とみなすことができる.そのため,文字列データを高速かつ省領域で処理する基盤技術の開発は,情報爆発時代における喫緊の課題となっている.本研究では,テキストTとパターンPの2つの文字列が与えられたとき,TにおけるPの出現位置を求める文字列照合問題を取り扱う.特に,パラメタ化文字列照合問題という,文字の置換を許した照合問題に対する高速なアルゴリズムの開発に取り組む.文字列X中の文字を置き換えることで,文字列Yと合致するとき,文字列XとYはパラメタ化合致するという.パラメタ化文字列照合問題とは,テキスト文字列Tとパターン文字列Pが与えられたとき,PがT中でパラメタ化合致する位置の集合を求める問題である.パラメタ化文字列照合は,ソフトウェアメンテナンスや盗作検出,RNA配列の2次構造照合など,計算機科学やバイオ情報学の重要課題の基盤となるものである.しかしながら,素朴な方法では,パラメタ化文字列照合問題を解くために膨大な時間を要してしまう.今年度は,パラメタ化文字列照合問題と密接な関係を持つ,回文照合問題に取り組み,これを高速に解くアルゴリズムの開発に成功した.既存研究において,アルファベットサイズが3以下のとき,回文照合問題を線形時間で解くアルゴリズムが提案されていたが,より大きなアルファベットサイズにおいては,効率的な手法は知られていなかった.本研究では,これを線形時間で解く世界初のアルゴリズムの開発に成功した.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究実績の概要で述べたとおり,任意のサイズのアルファベットに対して,回文照合問題を線形時間で解くアルゴリズムの開発に成功している.このアルゴリズムの実行時間は,理論的にはこれ以上の高速化が望めない最適なものである.パラメタ化文字列照合と同様に,回文照合もまたRNAの2次構造発見等への応用が可能である.しかしながら,既存の回文照合手法はアルファベットサイズが3以下の場合にのみ適用可能であり,アルファベットサイズが4であるRNA配列に適用できないという課題があった.本研究の成果は,この課題を正面から解決したものであり,その意義は極めて大きい.

今後の研究の推進方策

次年度以降は,圧縮された文字列データ上で高速に動作するアルゴリズムの開発を行う.圧縮データを陽に展開することなく,様々な処理を行うことができれば,データの保存領域の大幅な節減に繋がる.また,圧縮データに内在する組み合わせ的性質を利用することで,領域の節約だけでなく,処理時間の高速化をも達成できる可能性がある.

次年度の研究費の使用計画

圧縮データ上で動作する高速アルゴリズムの開発のために,既存技術の徹底的なサーベイを行う.当該分野の第一線で活躍する研究者が集う会議に積極的に参加し,最新の研究成果を網羅するとともに,新技術開発のためのディスカッションを行う.このため,国際会議参加や研究打ち合わせを目的として,数度の海外出張を予定している.また,東北大学の共同研究グループとの研究打ち合わせや,国内の会議への参加も積極的に行う予定である.研究成果をまとめるために,計算機や周辺機器の購入も適宜行う予定である.

  • 研究成果

    (19件)

すべて 2012 2011 その他

すべて 雑誌論文 (9件) (うち査読あり 9件) 学会発表 (8件) 備考 (2件)

  • [雑誌論文] Finding Characteristic Substrings from Compressed Texts2012

    • 著者名/発表者名
      Shunsuke Inenaga and Hideo Bannai
    • 雑誌名

      International Journal of Foundations of Computer Science

      巻: 23(2) ページ: 261-280

    • DOI

      10.1142/S0129054112400126

    • 査読あり
  • [雑誌論文] Computing q-gram Non-overlapping Frequencies on SLP Compressed Texts2012

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 雑誌名

      In Proc. the 38th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7147 ページ: 301-312

    • DOI

      10.1007/978-3-642-27660-6_25

    • 査読あり
  • [雑誌論文] Verifying and Enumerating Parameterized Border Arrays2011

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      Theoretical Computer Science

      巻: 412(50) ページ: 6959-6981

    • DOI

      10.1016/j.tcs.2011.09.008

    • 査読あり
  • [雑誌論文] Fast q-gram Mining on SLP Compressed Strings2011

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 雑誌名

      In Proc. the 18th Symposium on String Processing and Information Retrieval (SPIRE 2011), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 7024 ページ: 278-289

    • DOI

      10.1007/978-3-642-24583-1_27

    • 査読あり
  • [雑誌論文] Faster Subsequence and Don't-Care Pattern Matching on Compressed Texts2011

    • 著者名/発表者名
      Takanori Yamamoto, Hideo Bannai, Shunsuke Inenaga and Masayuki Takeda
    • 雑誌名

      In Proc. the 22nd Annual Symposium on Combinatorial Pattern Matching (CPM 2011), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 6661 ページ: 309-322

    • DOI

      10.1007/978-3-642-21458-5_27

    • 査読あり
  • [雑誌論文] Palindrome Pattern Matching2011

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga and Masayuki Takeda
    • 雑誌名

      In Proc. the 22nd Annual Symposium on Combinatorial Pattern Matching (CPM 2011), Lecture Notes in Computer Science, (Springer-Verlag)

      巻: 6661 ページ: 232-245

    • DOI

      10.1007/978-3-642-21458-5_21

    • 査読あり
  • [雑誌論文] Finding Missing Patterns2011

    • 著者名/発表者名
      Stanislav Angelov, Shunsuke Inenaga, Teemu Kivioja, and Veli Makinen
    • 雑誌名

      Journal of Discrete Algorithms

      巻: 9(2) ページ: 153-165

    • DOI

      10.1016/j.jda.2010.08.005

    • 査読あり
  • [雑誌論文] Inferring Strings from Suffix Trees and Links on a Binary Alphabet2011

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      Proc. The Prague Stringology Conference 2011 (PSC 2011)

      巻: - ページ: 121-131

    • 査読あり
  • [雑誌論文] Computing Longest Common Substring/Subsequence of Non-linear Texts2011

    • 著者名/発表者名
      Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 雑誌名

      Proc. The Prague Stringology Conference 2011 (PSC 2011)

      巻: - ページ: 197-20

    • 査読あり
  • [学会発表] Computing q-gram Non-overlapping Frequencies on SLP Compressed Texts2012

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 学会等名
      38th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2012)
    • 発表場所
      Spindleruv Mlyn, Czech Republic
    • 年月日
      20120121-27
  • [学会発表] Inferring Strings from Suffix Trees and Links on a Binary Alphabet2011

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      The Prague Stringology Conference 2011 (PSC 2011)
    • 発表場所
      Prague, Czech Republic
    • 年月日
      2011年8月30日
  • [学会発表] Computing Longest Common Substring/Subsequence of Non-linear Texts2011

    • 著者名/発表者名
      Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      The Prague Stringology Conference 2011 (PSC 2011)
    • 発表場所
      Prague, Czech Republic
    • 年月日
      2011年8月30日
  • [学会発表] 山本淳一,稲永俊介,坂内英夫,竹田正幸2011

    • 著者名/発表者名
      非線形コラージュシステムにおける文字列パターン照合
    • 学会等名
      コンピュテーション研究会
    • 発表場所
      信州大学
    • 年月日
      2011年 5月11日
  • [学会発表] 下平浩二,稲永俊介,坂内英夫,竹田正幸2011

    • 著者名/発表者名
      非線形テキストにおける最長共通部分文字列・部分列アルゴリズム
    • 学会等名
      コンピュテーション研究会
    • 発表場所
      信州大学
    • 年月日
      2011年 5月11日
  • [学会発表] Fast q-gram Mining on SLP Compressed Strings2011

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • 学会等名
      18th Symposium on String Processing and Information Retrieval (SPIRE 2011)
    • 発表場所
      Pisa, Italy
    • 年月日
      20111017-21
  • [学会発表] Faster Subsequence and Don't-Care Pattern Matching on Compressed Texts2011

    • 著者名/発表者名
      Takanori Yamamoto, Hideo Bannai, Shunsuke Inenaga and Masayuki Takeda
    • 学会等名
      22nd Annual Symposium on Combinatorial Pattern Matching (CPM 2011)
    • 発表場所
      Palermo, Italy
    • 年月日
      20110627-29
  • [学会発表] Palindrome Pattern Matching2011

    • 著者名/発表者名
      Tomohiro I, Shunsuke Inenaga and Masayuki Takeda
    • 学会等名
      22nd Annual Symposium on Combinatorial Pattern Matching (CPM 2011)
    • 発表場所
      Palermo, Italy
    • 年月日
      20110627-19
  • [備考]

    • URL

      http://str.i.kyushu-u.ac.jp/~inenaga/index-j.html

  • [備考]

    • URL

      http://hyoka.ofc.kyushu-u.ac.jp/search/details/K003385/index.html

URL: 

公開日: 2013-07-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi