• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

高速ネットワークのための文字列ストリーム処理アルゴリズム

Research Project

Project/Area Number 17700019
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Fundamental theory of informatics
Research InstitutionKyushu University

Principal Investigator

定兼 邦彦  九州大学, 大学院システム情報科学研究院, 助教授 (20323090)

Project Period (FY) 2005 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2006: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2005: ¥700,000 (Direct Cost: ¥700,000)
Keywords文字列処理 / 接尾辞木 / データ圧縮 / Rank / Select / データマイニング / 情報検索
Research Abstract

文字列の高速検索のために用いられるデータ構造である接尾辞木について,それを圧縮したデータ構造を開発した.このデータ構造は従来の接尾辞木でできる操作は全て可能であり,その計算量もほとんどの操作では圧縮前と同じである.このデータ構造により,多くの文字列処理問題を解くために必要なメモリを削減することができる.
Rank/Select辞書とは,順序集合$S in {0,1,...,m-1}$において${it rank}(x,S)=|{y in S|y le x }|$と${it select}(i,S)$($S$の中で$i$番目に小さい要素)を返すデータ構造である.これは文字列,木,グラフなどの圧縮データ構造の基本構成要素であり,多くのデータ構造が提案されている.しかしそれらは漸近的な性能のみを考えており,実データに対する性能は良くない.本研究では単純なRank/Select辞書を提案する.特徴としては,集合$S$の要素数が小さい場合にデータ構造のサイズを縮小できることと,データ構造が単純であるために実装が容易で,実データに対する性能(データ構造のサイズと問い合わせ時間)が良い.実験により,既存の実装よりも速度,サイズともに優れていることを示した.集合$S$は長さ$m$の${0,1}$のベクトル$B[0,m-1]$を用いて表現できる.しかしベクトル$B$をそのまま格納するデータ構造は,$S$の要素数$n$が小さい場合,または多い場合にはサイズに無駄が多い.なぜなら$B$は$m choose n$通りしかないため,$B(n,m)=log{m choose n}approx n log frac{m}{n}+(m-n)log frac{m}{m-n}$ビットで表現できるからである.Ramanら$rank$と$select$を定数時間で求める$B(n,m)+Order(m log log m/log m)$ビットのデータ構造を提案した.本研究で提案するデータ構造は,疎なベクトルに対してデータ構造のサイズが小さくなり,問い合わせ時間は既存のどのデータ構造よりも高速である.

Report

(2 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • Research Products

    (10 results)

All 2007 2006 2005

All Journal Article (10 results)

  • [Journal Article] Compressed Suffix Trees with Full Functionality2007

    • Author(s)
      Kunihiko Sadakane
    • Journal Title

      Theory of Computing Systems Online First(印刷中)

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Practical Entropy-Compressed Rank/Select Dictionary2007

    • Author(s)
      Daisuke Okanohara, Kunihiko Sadakane
    • Journal Title

      Proceedings of Workshop on Algorithm Engineering and Experiments (ALENEX) (印刷中)

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 圧縮データ構造2006

    • Author(s)
      定兼 邦彦
    • Journal Title

      電子情報通信学会論文誌 Vol. J89-A,No. 6

      Pages: 470-475

    • NAID

      110007384397

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 単純なRank/Select辞書2006

    • Author(s)
      定兼 邦彦
    • Journal Title

      電子情報通信学会技術研究報告COMP Vol. 106,No. 128

      Pages: 43-48

    • NAID

      110004751008

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 順序木の新しい表現法2006

    • Author(s)
      Jesper Jansson, 定兼 邦彦, Wing-Kin Sung
    • Journal Title

      電子情報通信学会技術研究報告COMP vol. 106,no. 258

      Pages: 31-37

    • NAID

      110004823538

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Squeezing Succinct Data Structures into Entropy Bounds2006

    • Author(s)
      K.Sadakane, R.Grossi
    • Journal Title

      Proceedings of ACM-SIAM Symposium on Discrete Algorithms (SODA)

      Pages: 1230-1239

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Linear time algorithm for approximating a curve by a single-peaked curve2005

    • Author(s)
      J.Chun, K.Sadakane, T.Tokuyama
    • Journal Title

      Algorithmica Vol.44, No.2

      Pages: 103-115

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Combinatorics and algorithms for low-discrepancy roundings of a real sequence2005

    • Author(s)
      K.Sadakane, N.Takki-Chebihi, T.Tokuyama
    • Journal Title

      Theoretical Computer Science Vol.331, No.1

      Pages: 23-36

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Computing the maximum agreement of phylogenetic networks2005

    • Author(s)
      C.Choy, J.Jansson, K.Sadakane, W.-K.Sung
    • Journal Title

      Theoretical Computer Science Vol.335, No.1

      Pages: 93-107

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Finding Short Right-Hand-on-the-Wall Walks in Graphs2005

    • Author(s)
      S.Dobrev, J.Jansson, K.Sadakane, W.-K.Sung
    • Journal Title

      Structural Information and Communication Complexity, 12^<th> International Colloquium LNCS3499

      Pages: 127-139

    • Related Report
      2005 Annual Research Report

URL: 

Published: 2005-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi