2007 Fiscal Year Annual Research Report

実際的簡潔データ構造の開発と大量データ活用

Research Project

Project/Area Number	19680001
Research Institution	Kyushu University
Principal Investigator	定兼邦彦 Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)
Keywords	データ圧縮 / 情報検索 / 簡潔データ構造 / 接尾辞配列 / 接尾辞木 / 圧縮接尾辞配列
Research Abstract	接尾辞は文字列検索のための代表的データ構造である.長さ$n$,アルファベットサイ$\sizealph$の文字列$S$に対し,従来のデータ構造では接尾辞木は$\Order(n\log n)$ビット,具体的な実装では$n<2^{30}$のときに$10n$〜$13n$バイトの領域を必要としていた.これは文字列自身のサイズ($n\log\sizealph$ビット,通常の文字列では$n$バイト,DNAでは$n/4$バイト)と比較すると非常に大きい.本研究で提案した圧縮接尾辞木は,接尾辞木の機能を保ったままサイズを圧縮する.圧縮接尾辞木のデータ構造は,文字列に対する圧縮接尾辞配列,接尾辞木の木構造を表現する簡潔データ構造,木の枝長を表現するデータ構造から構成される.各構成要素のサイズはそれぞれ$\Order(n\log\sizealph)$ビット,$4n+\order(n)$ビット,$2n+\order(n)$ビットである.このデータ構造は接尾辞木を線形サイズ($\Order(n\log\sizealph$ビット)で表現する初めてののデータ構造である.接尾辞木の巡回などの演算は多くは圧縮前と同じ時間計算量で行える.一部の演算は圧縮前よりも遅くなるが,その計算量は圧縮接尾辞配列の1要素を復元する時間と等しく,速度低下はわずかである.

Research Products
(5 results)

All 2008 2007 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

[Journal Article] Faster Suffix Sorting2007
- Author(s)
  J, Larsson・K, Sadakane
- Journal Title
  
  Theoretical Computer Science 387(3):
  
  Pages: 258-272
- Peer Reviewed
[Journal Article] Compressed Suffix Trees with Full Functionality2007
- Author(s)
  K, Sadakane
- Journal Title
  
  Theory of Computing Systems 41(4):
  
  Pages: 589-607
- Peer Reviewed
[Journal Article] Succinct Data Structures for Flexible Text Retrieval Systems2007
- Author(s)
  K, Sadakane
- Journal Title
  
  Journal of Discrete Algorithms 5(1):
  
  Pages: 12-22
- Peer Reviewed
[Presentation] DNA配列に適した圧縮全文索引2008
- Author(s)
  定兼邦彦
- Organizer
  電子情報通信学会コンピュテーション研究会
- Place of Presentation
  日本IBM東京基礎研究所
- Year and Date
  2008-03-10
[Remarks]
- URL
  http://tcslab.csce.kyushu-u.ac.jp/~sada/

2007 Fiscal Year Annual Research Report

実際的簡潔データ構造の開発と大量データ活用

Principal Investigator

定兼 邦彦 Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)

Research Products

[Journal Article] Faster Suffix Sorting2007

Author(s)

Journal Title

[Journal Article] Compressed Suffix Trees with Full Functionality2007

Author(s)

Journal Title

[Journal Article] Succinct Data Structures for Flexible Text Retrieval Systems2007

Author(s)

Journal Title

[Presentation] DNA配列に適した圧縮全文索引2008

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

定兼邦彦 Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)