• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

実際的簡潔データ構造の開発と大量データ活用

Research Project

Project/Area Number 19680001
Research InstitutionKyushu University

Principal Investigator

定兼 邦彦  Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)

Keywordsデータ圧縮 / 情報検索 / 簡潔データ構造 / 接尾辞配列 / 接尾辞木 / 圧縮接尾辞配列
Research Abstract

接尾辞は文字列検索のための代表的データ構造である.長さ$n$,アルファベットサイ$\sizealph$の文字列$S$に対し,従来のデータ構造では接尾辞木は$\Order(n\log n)$ビット,具体的な実装では$n<2^{30}$のときに$10n$〜$13n$バイトの領域を必要としていた.これは文字列自身のサイズ($n\log\sizealph$ビット,通常の文字列では$n$バイト,DNAでは$n/4$バイト)と比較すると非常に大きい.本研究で提案した圧縮接尾辞木は,接尾辞木の機能を保ったままサイズを圧縮する.圧縮接尾辞木のデータ構造は,文字列に対する圧縮接尾辞配列,接尾辞木の木構造を表現する簡潔データ構造,木の枝長を表現するデータ構造から構成される.各構成要素のサイズはそれぞれ$\Order(n\log\sizealph)$ビット,$4n+\order(n)$ビット,$2n+\order(n)$ビットである.このデータ構造は接尾辞木を線形サイズ($\Order(n\log\sizealph$ビット)で表現する初めてののデータ構造である.接尾辞木の巡回などの演算は多くは圧縮前と同じ時間計算量で行える.一部の演算は圧縮前よりも遅くなるが,その計算量は圧縮接尾辞配列の1要素を復元する時間と等しく,速度低下はわずかである.

  • Research Products

    (5 results)

All 2008 2007 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] Faster Suffix Sorting2007

    • Author(s)
      J, Larsson・K, Sadakane
    • Journal Title

      Theoretical Computer Science 387(3):

      Pages: 258-272

    • Peer Reviewed
  • [Journal Article] Compressed Suffix Trees with Full Functionality2007

    • Author(s)
      K, Sadakane
    • Journal Title

      Theory of Computing Systems 41(4):

      Pages: 589-607

    • Peer Reviewed
  • [Journal Article] Succinct Data Structures for Flexible Text Retrieval Systems2007

    • Author(s)
      K, Sadakane
    • Journal Title

      Journal of Discrete Algorithms 5(1):

      Pages: 12-22

    • Peer Reviewed
  • [Presentation] DNA配列に適した圧縮全文索引2008

    • Author(s)
      定兼邦彦
    • Organizer
      電子情報通信学会コンピュテーション研究会
    • Place of Presentation
      日本IBM東京基礎研究所
    • Year and Date
      2008-03-10
  • [Remarks]

    • URL

      http://tcslab.csce.kyushu-u.ac.jp/~sada/

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi