• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

実際的簡潔データ構造の開発と大量データ活用

Research Project

Project/Area Number 19680001
Research InstitutionKyushu University

Principal Investigator

定兼 邦彦  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (20323090)

Keywords簡潔データ構造 / 順序木 / データ圧縮 / 接尾辞配列 / 文字列検索
Research Abstract

これまでに開発してきた簡潔データ構造をライブラリとして公開した.このライブラリは,ビット列,文字列を格納するデータ構造,文字列の検索を行うための圧縮接尾辞配列,圧縮接尾辞木の簡潔データ構造を含む.また,メモリに収まらない大きさの接尾辞配列を構築する2つのプログラムを公開した.1つは文字列のBW変換がメモリに収まるが接尾辞配列はメモリに収まらない場合に,BW変換を高速に実行するもので,もう1つは文字列のBW変換もメモリに収まらない場合にディスクを使って変換を行うものである.後者のプログラムを用いて,日本の特許5年分の全文書約110ギガバイトに対する圧縮接尾辞配列を構築することに成功した.接尾辞配列のサイズは680ギガバイトだが,これを圧縮した圧縮接尾辞配列のサイズは約22ギガバイトとなり,大幅な圧縮を達成した.
また,文字列を文法圧縮するアルゴリズムを開発した.これにより,類似文字列が大量にある場合に高い圧縮率を達成することができる.さらに,高速復元可能な接尾辞配列圧縮法を開発した.これは圧縮接尾辞配列よりも圧縮率は悪いが,復元は高速である.

  • Research Products

    (5 results)

All 2011 2010 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] Random Access to grammar-Compressed Strings2011

    • Author(s)
      Philip Bille, Gad M.Landau, Rajeev Raman, Kunihiko Sadakane, Srinivasa Rao Satti, Oren Weimann
    • Journal Title

      Proceedings of ACM-SIAM SODA

      Pages: 373-389

    • Peer Reviewed
  • [Journal Article] Faster Computation of the Robinson-Foulds Distance between Phylogenetic Networks2010

    • Author(s)
      Tetsuo Asano, Jesper Jansson, Kunihiko Sadakane, Ryuhei Uehara, Gabriel Valiente
    • Journal Title

      Proceedings of CPM

      Volume: LNCS 6129 Pages: 190-201

    • Peer Reviewed
  • [Journal Article] 高速復元可能な接尾辞配列圧縮法2010

    • Author(s)
      田中洋輔, 小野廣隆, 定兼邦彦, 山下雅史
    • Journal Title

      電子情報通信学会論文誌D

      Volume: J93-D(8) Pages: 1567-1575

    • Peer Reviewed
  • [Presentation] 文法圧縮された文字列のランダムアクセス2010

    • Author(s)
      定兼邦彦
    • Organizer
      日本オペレーションズ・リサーチ学会研究部会画期における最適化
    • Place of Presentation
      京都大学(京都府)
    • Year and Date
      2010-12-07
  • [Remarks] 圧縮接尾辞配列ライブラリcsalib

    • URL

      http://researchmap.jp/sada/csalib/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi