• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

大量データ処理のための領域効率の良いアルゴリズム

研究課題

研究課題/領域番号 16092222
研究機関九州大学

研究代表者

定兼 邦彦  九州大学, 大学院・システム情報科学研究院, 准教授 (20323090)

研究分担者 山下 雅史  九州大学, 大学院・システム情報科学研究院, 教授 (00135419)
小野 廣隆  九州大学, 大学院・システム情報科学研究院, 助教 (00346826)
キーワード領域計算量 / グラフ探索 / 簡潔データ構造 / データ圧縮
研究概要

本研究では大量データ処理のための領域効率の良いアルゴリズムの開発を行った.大量データ処理を行う際の問題点としては,処理時間だけではなく,データの格納やアルゴリズムの動作に必要な記憶領域の大きさがある.よって本研究では領域効率の良いアルゴリズムの開発に重点を置き,以下のアブローチを行った.(1)データを圧縮する:データ自身やデータ構造を圧縮して保存する簡潔データ構造を開発し,少ないメモリで大量のデータを扱えるようにした.(2)データの一部分のみをメモリに格納するアルゴリズム:全体のデータ量は多いが,同時にはその限られた部分のデータのみを使用するようなアルゴリズムならば限られたメモリでも動作する.本研究では特に,グラフの探索を行う省スペースアルゴリズムを開発した.その結果,大量データ処理のための基礎となるアルゴリズムとデータ構造を開発できた.
全てのデータは文字列とみなす事ができる.その文字列の長さをn,文字のアルファベットサイズをσとすると,データの圧縮前のサイズはnlog_2 σビットとなる.通常のデータ圧縮法ではこの文字列をnH_k+o(n log σ)ビットに圧縮するが,その一部分のみアクセスしたい場合でも圧縮されたデータ全体を復元する必要がある.本研究の圧縮法では,圧縮された文字列の任意の部分を高速に復元できる.具体的には,文字列中の位置が指定されたとき,その位置から始まる部分文字列で長さがlog nビットのものを定数時間で復元することができる.圧縮サイズはnH_k+o(n log σ)ビットであり従来法と漸近的に等しい.

  • 研究成果

    (5件)

すべて 2008 2007 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] Compressed indexes for dynamic text collections2008

    • 著者名/発表者名
      H-L, Chan・W-K, Hon・T-W, Lam・K., Sadakane
    • 雑誌名

      ACM Transactions on Algorithms 3(2)(in press)

    • 査読あり
  • [雑誌論文] Compressed Dynamic Tries with Applications to LZ-Compression in Sublinear Time and Space2007

    • 著者名/発表者名
      Jesper, Jansson・Kunihiko, Sadakane・Wing-Kin, Sung:
    • 雑誌名

      International Conference on the Foundations of Software Technology and Theoretical Computer Science LNCS 4855

      ページ: 424-435

    • 査読あり
  • [雑誌論文] A Space and Time Efficient Algorithm for Constructing Compressed Suffix Arrays2007

    • 著者名/発表者名
      W-K., Hon・T-W, Lam・K., Sadakane・W-K, Sung・S-M, Yiu:
    • 雑誌名

      Algorithmica 48(1)

      ページ: 23-36

    • 査読あり
  • [学会発表] Ultra-succinct representation of ordered trees2007

    • 著者名/発表者名
      Kunihiko, Sadakane
    • 学会等名
      ACM-SIAM Symposium on Discrete Algorithms
    • 発表場所
      アメリカ, ニューオーリンズ
    • 年月日
      2007-01-08
  • [備考]

    • URL

      http://tcslab.csce.kyushu-u.ac.jp/~sada/

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi