• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

巨大データからの知識発見を可能にする圧縮文字列処理基盤技術

研究課題

研究課題/領域番号 13J04937
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
研究分野 知能情報学
研究機関九州大学

研究代表者

後藤 啓介  九州大学, 大学院システム情報科学府, 特別研究員DC2

研究期間 (年度) 2013
研究課題ステータス 完了 (2013年度)
配分額 *注記
1,000千円 (直接経費: 1,000千円)
2013年度: 1,000千円 (直接経費: 1,000千円)
キーワードアルゴリズム / 圧縮文字列処理
研究概要

LZ77圧縮に着目し, LZ77圧縮を省領域で計算するアルゴリズムの開発を行った. LZ77圧縮は理論的にも実用的にも圧縮率の良い圧縮法であることが知られており, 圧縮用途以外にも, 連の解析や周期の発見など文字列解析に幅広く応用される, 汎用かつ知識発見において重要な位置づけにある圧縮データ構造である. そのような応用を考える上でボトルネックとなるのがLZ77圧縮の計算にかかる時間と領域であり, 省領域で動作する線形時間アルゴリズムの開発が求められている. LZ77圧縮は入力テキスト全体に渡る繰り返し構造を計算する必用があるため, 線形時間アルゴリズムの開発にはテキストの索引構造とその補助データ構造を使うことが一般的であり, より省領域なアルゴリズムの開発はこれらのデータ構造の領域を如何に削減するかが課題であった. 筆者は計算に必要な使用領域の削減に取り組み, NlogN+0(σlog N) bits領域を使用する線形時間アルゴリズムを提案した, ここでNは入力テキストサイズ, σはアルファベットサイズである. 先行研究で最も省領域な2N log Nbitsを使用する線形時間アルゴリズムKKP2と比較すると, アルファベットサイズが小さい場合, 提案手法はKKP2に比べほぼ半分の領域で動作し, 大きな改善に成功している. 計算機実験によりKKP2と新手法の実行時間を比較した場合, 新手法は領域を半分程度に抑えた事による計算の複雑さが増したにも関わらず, 実行時間はKKP2の2倍ほどの実行時間の増加に留まっているとの結果が得られた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

圧縮や, 文字列の解析などに応用される重要な圧縮データ構造について, 最も省領域で動作する線形時間のアルゴリズムの開発に成功した. このことにより, これまで適用困難だったサイズのデータについても適用可能となり, テーマに沿って研究が進展していると考えている.

今後の研究の推進方策

今年度に行った研究で, ある程度まとまった結果が出たにも関わらず, 論文投稿が間に合わなかったトピックがある. 来年度移行順次, 国際会議, 学術雑誌に投稿していく予定である.

報告書

(1件)
  • 2013 実績報告書
  • 研究成果

    (1件)

すべて 2014

すべて 学会発表 (1件)

  • [学会発表] Space Efficient Linear Time Lempel-Ziv Factorization for Small Alphabets2014

    • 著者名/発表者名
      後藤 啓介
    • 学会等名
      Data Compression Conference
    • 発表場所
      アメリカ合衆国, ユタ州
    • 年月日
      2014-03-26
    • 関連する報告書
      2013 実績報告書

URL: 

公開日: 2014-01-29   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi