大量データ処理のための領域効率の良いアルゴリズム

研究課題

研究課題/領域番号	16092222
研究種目	特定領域研究
配分区分	補助金
審査区分	理工系
研究機関	九州大学
研究代表者	定兼邦彦九州大学, 大学院・システム情報科学研究院, 准教授 (20323090)
研究分担者	山下雅史九州大学, 大学院・システム情報科学研究院, 教授 (00135419) 小野廣隆九州大学, 大学院・システム情報科学研究院, 助教 (00346826)
研究期間 (年度)	2004 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	13,000千円 (直接経費: 13,000千円) 2007年度: 3,200千円 (直接経費: 3,200千円) 2006年度: 3,400千円 (直接経費: 3,400千円) 2005年度: 3,500千円 (直接経費: 3,500千円) 2004年度: 2,900千円 (直接経費: 2,900千円)
キーワード	領域計算量 / グラフ探索 / 簡潔データ構造 / データ圧縮 / エントロピー / スケールフリーグラフ / 逆探索 / 情報検索 / データ構造 / 接尾辞配列 / 圧縮接尾辞配列 / 文字列検索 / 文字列圧縮 / 省スペース / オンラインアルゴリズム / Web検索 / 並列化
研究概要	本研究では大量データ処理のための領域効率の良いアルゴリズムの開発を行った.大量データ処理を行う際の問題点としては,処理時間だけではなく,データの格納やアルゴリズムの動作に必要な記憶領域の大きさがある.よって本研究では領域効率の良いアルゴリズムの開発に重点を置き,以下のアブローチを行った.(1)データを圧縮する:データ自身やデータ構造を圧縮して保存する簡潔データ構造を開発し,少ないメモリで大量のデータを扱えるようにした.(2)データの一部分のみをメモリに格納するアルゴリズム:全体のデータ量は多いが,同時にはその限られた部分のデータのみを使用するようなアルゴリズムならば限られたメモリでも動作する.本研究では特に,グラフの探索を行う省スペースアルゴリズムを開発した.その結果,大量データ処理のための基礎となるアルゴリズムとデータ構造を開発できた. 全てのデータは文字列とみなす事ができる.その文字列の長さをn,文字のアルファベットサイズをσとすると,データの圧縮前のサイズはnlog_2 σビットとなる.通常のデータ圧縮法ではこの文字列をnH_k+o(n log σ)ビットに圧縮するが,その一部分のみアクセスしたい場合でも圧縮されたデータ全体を復元する必要がある.本研究の圧縮法では,圧縮された文字列の任意の部分を高速に復元できる.具体的には,文字列中の位置が指定されたとき,その位置から始まる部分文字列で長さがlog nビットのものを定数時間で復元することができる.圧縮サイズはnH_k+o(n log σ)ビットであり従来法と漸近的に等しい.

報告書

(4件)

研究成果
(23件)

すべて 2008 2007 2006 2005 2004 その他

すべて雑誌論文 (21件) (うち査読あり 3件) 学会発表 (1件) 備考 (1件)

[雑誌論文] Compressed indexes for dynamic text collections2008
- 著者名/発表者名
  H-L, Chan・W-K, Hon・T-W, Lam・K., Sadakane
- 雑誌名
  
  ACM Transactions on Algorithms 3(2)(in press)
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Compressed Dynamic Tries with Applications to LZ-Compression in Sublinear Time and Space2007
- 著者名/発表者名
  Jesper, Jansson・Kunihiko, Sadakane・Wing-Kin, Sung:
- 雑誌名
  
  International Conference on the Foundations of Software Technology and Theoretical Computer Science LNCS 4855
  
  ページ: 424-435
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] A Space and Time Efficient Algorithm for Constructing Compressed Suffix Arrays2007
- 著者名/発表者名
  W-K., Hon・T-W, Lam・K., Sadakane・W-K, Sung・S-M, Yiu:
- 雑誌名
  
  Algorithmica 48(1)
  
  ページ: 23-36
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Ultra-succinct Representation of Ordered Trees2007
- 著者名/発表者名
  Jesper Jansson, Kunihiko Sadakane, Wing-Kin Sung
- 雑誌名
  
  Proceedings of ACM-SIAM Symposium on Discrete Algorithms
  
  ページ: 575-584
- 関連する報告書
  2006 実績報告書
[雑誌論文] Forest Search : A Paradigm for Faster Exploration of Scale-Free Networks2006
- 著者名/発表者名
  Y.Kurumida, H.Ono, K.Sadakane, M.Yamashita
- 雑誌名
  
  Proc. of the 4th International Symposium on Parallel and Distributed Processing and Applications LNCS 4330
  
  ページ: 39-50
- 関連する報告書
  2006 実績報告書
[雑誌論文] Reducing the space requirement of LZ-index2006
- 著者名/発表者名
  D.Arroyuelo, G.Navarro, K.Sadakane
- 雑誌名
  
  Proceedings of Combinatorial Pattern Matching LNCS 4009
  
  ページ: 307-318
- 関連する報告書
  2006 実績報告書
[雑誌論文] A Probabilistic Model of the DNA Conformational Change2006
- 著者名/発表者名
  M.Shiozaki, H.Ono, K.Sadakane, M.Yamashita
- 雑誌名
  
  Proceedings of DNA LNCS 4287
  
  ページ: 274-285
- NAID
  120006655004
- 関連する報告書
  2006 実績報告書
[雑誌論文] DNA Sequence Design by Dynamic Neighborhood Searches2006
- 著者名/発表者名
  S.Kawashimo, H.Ono, K.Sadakane, M.Yamashita
- 雑誌名
  
  Proceedings of DNA LNCS 4287
  
  ページ: 157-171
- NAID
  110004741455
- 関連する報告書
  2006 実績報告書
[雑誌論文] A generic search strategy for large-scale real-world networks2006
- 著者名/発表者名
  Y.Kurumida, T.Ogata, H.Ono, K.Sadakane, M.Yamashita
- 雑誌名
  
  Proc. INFOSCALE, ACM International Conference Proceeding Series Vol. 152
  
  ページ: 53-53
- NAID
  120006654471
- 関連する報告書
  2006 実績報告書
[雑誌論文] Rooted Maximum Agreement Supertrees2005
- 著者名/発表者名
  J.Jansson, H.-K.Ng, K.Sadakane, W.-K.Sung
- 雑誌名
  
  Algorithmica Vol.43, No.4
  
  ページ: 293-307
- 関連する報告書
  2005 実績報告書
[雑誌論文] Energy-Optimal Online Algorithms for Broadcasting in Wireless Networks2005
- 著者名/発表者名
  S.Kutten, H.Ono, D.Peleg, K.Sadakane, M.Yamashita
- 雑誌名
  
  IEEE The Second Annual Conference on Wireless On demand Network Systems and Services
  
  ページ: 125-130
- 関連する報告書
  2005 実績報告書
[雑誌論文] A Local Search Based Barrier Height Estimation Algorithm for DNA Molecular Transitions2005
- 著者名/発表者名
  T.Takeda, H.Ono, K.Sadakane, M.Yamashita
- 雑誌名
  
  Preproceedings of DNA Computing, 11th International Workshop on DNA Based Computers
  
  ページ: 354-365
- 関連する報告書
  2005 実績報告書
[雑誌論文] Energy-Optimal Online Algorithms for Broadcasting in Wireless Networks2005
- 著者名/発表者名
  S.Kutten, H.Ono, D.Peleg, K.Sadakane, M.Yamashita
- 雑誌名
  
  Second Annual Conference on Wireless On-demand Network Systems and Services, Proceedings, IEEE Computer Society
  
  ページ: 125-160
- 関連する報告書
  2004 実績報告書
[雑誌論文] Dynamic Dictionary Matching and Compressed Suffix Trees2005
- 著者名/発表者名
  Ho-Leung Chan, Wing-Kai Hon, Tak-Wah Lam, Kunihiko Sadakane
- 雑誌名
  
  ACM-SIAM Symposium on Discrete Algorithms PR118
  
  ページ: 13-22
- 関連する報告書
  2004 実績報告書
[雑誌論文] A Web Scoring Method for Local Web Search Engines2004
- 著者名/発表者名
  Yohei Ikawa, Kunihiko Sadakane
- 雑誌名
  
  Database Systems for Advances Applications, 9th International Comference, DASFAA 2004, Lecture notes in Computer Science 2973
  
  ページ: 606-617
- 関連する報告書
  2004 実績報告書
[雑誌論文] Neighborhood Composition : A Parallelization of Local Search Algorithms2004
- 著者名/発表者名
  Yuichi Handa, Hirotaka Ono, Kunihiko Sadakane, Masafumi Yamashita
- 雑誌名
  
  Recent Advances in Parallel Virtual Machine and Message Passing Interface, Proceedings. Lecture Notes in Computer Science 3241
  
  ページ: 155-163
- NAID
  130004607933
- 関連する報告書
  2004 実績報告書
[雑誌論文] Advantages of Backward Searching - Efficient Secondary Memory and Distributed Implementation of Compressed Suffix Arrays2004
- 著者名/発表者名
  Veli Makinen, Gonzalo Navarro, Kunihiko Sadakane
- 雑誌名
  
  15th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 3241
  
  ページ: 681-692
- 関連する報告書
  2004 実績報告書
[雑誌論文] Rooted Maximum Agreement Supertrees2004
- 著者名/発表者名
  Jesper Jansson, Joseph H.-K.Ng, Kunihiko Sadakane, Wing-Kin Sung
- 雑誌名
  
  Theoretical Informatics, 6th Latin American Symposium, Proceedings. Lecture Notes in Computer Science 2976
  
  ページ: 499-508
- 関連する報告書
  2004 実績報告書
[雑誌論文] Succinct Data Structures for Flexible Text Retrieval Systems
- 著者名/発表者名
  K.Sadakane
- 雑誌名
  
  Journal of Discrete Algorithms (accepted)
- 関連する報告書
  2005 実績報告書
[雑誌論文] Compressed Indexes for Dynamic Text Collections
- 著者名/発表者名
  H.-L.Chan, W.-K.Hon, T.-W.Lam, K.Sadakane
- 雑誌名
  
  ACM Transactions on Algorithms (accepted)
- 関連する報告書
  2005 実績報告書
[雑誌論文] A Space and Time Efficient Algorithm for Constructing Compressed Suffix Arrays
- 著者名/発表者名
  W.-K.Hon, T.-W.Lam, K.Sadakane, W.-K.Sung, S.M.Yiu
- 雑誌名
  
  Algorithmica (accepted)
- 関連する報告書
  2005 実績報告書
[学会発表] Ultra-succinct representation of ordered trees2007
- 著者名/発表者名
  Kunihiko, Sadakane
- 学会等名
  ACM-SIAM Symposium on Discrete Algorithms
- 発表場所
  アメリカ, ニューオーリンズ
- 年月日
  2007-01-08
- 関連する報告書
  2007 実績報告書
[備考]
- URL
  http://tcslab.csce.kyushu-u.ac.jp/~sada/
- 関連する報告書
  2007 実績報告書

大量データ処理のための領域効率の良いアルゴリズム

研究代表者

定兼 邦彦 九州大学, 大学院・システム情報科学研究院, 准教授 (20323090)

13,000千円 (直接経費: 13,000千円)

報告書

研究成果

[雑誌論文] Compressed indexes for dynamic text collections2008

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Compressed Dynamic Tries with Applications to LZ-Compression in Sublinear Time and Space2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Space and Time Efficient Algorithm for Constructing Compressed Suffix Arrays2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Ultra-succinct Representation of Ordered Trees2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Forest Search : A Paradigm for Faster Exploration of Scale-Free Networks2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Reducing the space requirement of LZ-index2006

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Probabilistic Model of the DNA Conformational Change2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] DNA Sequence Design by Dynamic Neighborhood Searches2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] A generic search strategy for large-scale real-world networks2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Rooted Maximum Agreement Supertrees2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Energy-Optimal Online Algorithms for Broadcasting in Wireless Networks2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Local Search Based Barrier Height Estimation Algorithm for DNA Molecular Transitions2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Energy-Optimal Online Algorithms for Broadcasting in Wireless Networks2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Dynamic Dictionary Matching and Compressed Suffix Trees2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Web Scoring Method for Local Web Search Engines2004

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Neighborhood Composition : A Parallelization of Local Search Algorithms2004

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Advantages of Backward Searching - Efficient Secondary Memory and Distributed Implementation of Compressed Suffix Arrays2004

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Rooted Maximum Agreement Supertrees2004

著者名/発表者名

定兼邦彦九州大学, 大学院・システム情報科学研究院, 准教授 (20323090)