• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

大量データ処理のための領域効率の良いアルゴリズム

Research Project

Project/Area Number 16092222
Research InstitutionKyushu University

Principal Investigator

定兼 邦彦  Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)

Co-Investigator(Kenkyū-buntansha) 山下 雅史  九州大学, 大学院・システム情報科学研究院, 教授 (00135419)
小野 廣隆  九州大学, 大学院・システム情報科学研究院, 助教 (00346826)
Keywords領域計算量 / グラフ探索 / 簡潔データ構造 / データ圧縮
Research Abstract

本研究では大量データ処理のための領域効率の良いアルゴリズムの開発を行った.大量データ処理を行う際の問題点としては,処理時間だけではなく,データの格納やアルゴリズムの動作に必要な記憶領域の大きさがある.よって本研究では領域効率の良いアルゴリズムの開発に重点を置き,以下のアブローチを行った.(1)データを圧縮する:データ自身やデータ構造を圧縮して保存する簡潔データ構造を開発し,少ないメモリで大量のデータを扱えるようにした.(2)データの一部分のみをメモリに格納するアルゴリズム:全体のデータ量は多いが,同時にはその限られた部分のデータのみを使用するようなアルゴリズムならば限られたメモリでも動作する.本研究では特に,グラフの探索を行う省スペースアルゴリズムを開発した.その結果,大量データ処理のための基礎となるアルゴリズムとデータ構造を開発できた.
全てのデータは文字列とみなす事ができる.その文字列の長さをn,文字のアルファベットサイズをσとすると,データの圧縮前のサイズはnlog_2 σビットとなる.通常のデータ圧縮法ではこの文字列をnH_k+o(n log σ)ビットに圧縮するが,その一部分のみアクセスしたい場合でも圧縮されたデータ全体を復元する必要がある.本研究の圧縮法では,圧縮された文字列の任意の部分を高速に復元できる.具体的には,文字列中の位置が指定されたとき,その位置から始まる部分文字列で長さがlog nビットのものを定数時間で復元することができる.圧縮サイズはnH_k+o(n log σ)ビットであり従来法と漸近的に等しい.

  • Research Products

    (5 results)

All 2008 2007 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] Compressed indexes for dynamic text collections2008

    • Author(s)
      H-L, Chan・W-K, Hon・T-W, Lam・K., Sadakane
    • Journal Title

      ACM Transactions on Algorithms 3(2)(in press)

    • Peer Reviewed
  • [Journal Article] Compressed Dynamic Tries with Applications to LZ-Compression in Sublinear Time and Space2007

    • Author(s)
      Jesper, Jansson・Kunihiko, Sadakane・Wing-Kin, Sung:
    • Journal Title

      International Conference on the Foundations of Software Technology and Theoretical Computer Science LNCS 4855

      Pages: 424-435

    • Peer Reviewed
  • [Journal Article] A Space and Time Efficient Algorithm for Constructing Compressed Suffix Arrays2007

    • Author(s)
      W-K., Hon・T-W, Lam・K., Sadakane・W-K, Sung・S-M, Yiu:
    • Journal Title

      Algorithmica 48(1)

      Pages: 23-36

    • Peer Reviewed
  • [Presentation] Ultra-succinct representation of ordered trees2007

    • Author(s)
      Kunihiko, Sadakane
    • Organizer
      ACM-SIAM Symposium on Discrete Algorithms
    • Place of Presentation
      アメリカ, ニューオーリンズ
    • Year and Date
      2007-01-08
  • [Remarks]

    • URL

      http://tcslab.csce.kyushu-u.ac.jp/~sada/

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi