• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

文字列パターン発見および文字列データ分類におけるモデル選択アルゴリズムの研究

研究課題

研究課題/領域番号 20700141
研究機関九州大学

研究代表者

坂内 英夫  九州大学, システム情報科学研究院, 准教授 (20323644)

キーワードパターン発見 / パラメータ化文字列 / 繰り返し構造
研究概要

本年度はパラメータ化文字列パターンおよび繰り返し構造パターンに着目し,より高速にデータを処理するためのデータ構造お上び構築アルゴリズムの研究を行った.得られた主な成果は以下の通りである。(1) パラメータ化パターン照合を高速に行うためのデータ構造としてパラメータ化接尾辞配列を提案し,その高速な構築方法を考案した.また,パラメータ化接尾辞配列に対する最長共通接頭辞長配列に関しても高速に構築するアルゴリズムを考案した.これらのデータ構造を合わせて用いることで,最適パラメータ化部分文字列パターン発見のアルゴリズム,及びパラメータ化部分文字列カーネルを高速に計算するアルゴリズムを実現した.(2) パラメータ化文字列の組み合わせ的性質をより深く理解するために,パラメータ化ボーダー配列の逆問題と列挙問題に取り組んだ.バイナリ文字列の場合,それぞれの問題について入力長および出力長に比例する時間で解くアルゴリズムを示した.(3) 繰りの返し構造発見問題に関して,特に短い文字列に対して極めて高速に動作するビット並列手法に基づくアルゴリズムを開発した.従来の線形時間アルゴリズムはLZ分解など複雑な操作が必要であったのに対し,提案手法は非常に簡潔であり,大量の文字列に対して処理を並列化することが容易であった.実際にアルゴリズムを用いて長さ48以下のすべてのバイナリ文字列に対する繰り返し構造を列挙することができ,その性質について幾つかの知見を得た.

  • 研究成果

    (4件)

すべて 2009

すべて 雑誌論文 (4件) (うち査読あり 4件)

  • [雑誌論文] Bit-parallel algorithms for computing all the runs in a string2009

    • 著者名/発表者名
      K.Hirashima, H.Bannai, 他3名
    • 雑誌名

      Proc.Prague Stringology Conference 2009

      ページ: 203-213

    • 査読あり
  • [雑誌論文] Finding Characteristic Substrings from Compressed Texts2009

    • 著者名/発表者名
      S.Inenaga, H.Bannai
    • 雑誌名

      Proc.Prague Stringology Conference 2009

      ページ: 40-54

    • 査読あり
  • [雑誌論文] Lightweight Parameterized Suffix Array Construction2009

    • 著者名/発表者名
      T.I, S.Deguchi, H.Bannai, S.Inenaga, M. Takeda
    • 雑誌名

      Proc.20^<th> International Workshop on Combinatorial Algorithms LNCS 5874

      ページ: 312-323

    • 査読あり
  • [雑誌論文] Counting Parameterized Border Arrays for a Biriary Alphabet2009

    • 著者名/発表者名
      T.I, S.Inenaga, H.Bannai, M.Takeda
    • 雑誌名

      Proc.3^<rd> International Conf.on Language and Automata Theory and Applications LNCS 5457

      ページ: 422-433

    • 査読あり

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi