• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

ストリームデータを知識化する圧縮情報処理基盤の開発

Research Project

Project/Area Number 17H01791
Research InstitutionKyushu Institute of Technology

Principal Investigator

坂本 比呂志  九州工業大学, 大学院情報工学研究院, 教授 (50315123)

Co-Investigator(Kenkyū-buntansha) 竹田 正幸  九州大学, システム情報科学研究院, 教授 (50216909)
申 吉浩  学習院大学, 計算機センター, 教授 (60523587)
Project Period (FY) 2017-04-01 – 2022-03-31
Keywordsストリームデータ圧縮 / 知識発見
Outline of Annual Research Achievements

大きすぎて処理できないデータは存在しないものと同義である.本研究は,データ圧縮によって情報処理を加速し,巨大なデータの理解を可能にする計算基盤を提案する.現代は,多様で豊富なデータ,革新的なアルゴリズム,高性能なハードウェアのすべてが利用可能である.しかし,ストリームデータの激増によってこの均衡が崩れつつあり,アルゴリズムやハードウェアの飛躍的な性能向上が必要である.この問題を解決するひとつの光明として,申請者らによって,時間と領域を圧縮する手法が限定的ではあるが提案されている.本研究は,この圧縮情報処理の理論をストリームデータ上の広範囲な知識処理へ拡張し,ネットワークに氾濫する大規模非定型データの幅広い活用を可能にする.本研究の計画は,具体的な3つの目標を達成することからなっている.課題A:最適ストリーム圧縮理論の完成,課題B:ストリーム検索アルゴリズムの拡張,課題C:ストリームデータからの特徴抽出である.このうち,課題Aについては,理論的下限にほぼ等しい領域で,ストリーム圧縮が可能となる理論とアルゴリズムを完成させた.これによって,大規模ストリームデータを省スペースかつ高速に圧縮することが可能となった.さらに,このアルゴリズムを課題Bへ応用した.具体的には,これまでの圧縮索引と呼ばれる手法に適用し,ストリーム環境における圧縮索引とパターン発見を可能にした.さらに,これまではストリーム処理が困難であった圧縮法についてもオンラインアルゴリズムによる効率的な圧縮方法を確立した.これらの成果によって,課題Cに取り掛かる準備が整ったと言える.今後はリアルデータに対する特徴抽出を実現する.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

課題A:最適ストリーム圧縮理論の完成と課題B:ストリーム検索アルゴリズムの拡張について当初の計画通り順調に成果が上がっている.課題Aについては,理論的な下限とほぼ等しい領域で圧縮が可能となった.課題Bについては,これまでは困難であったBWTと呼ばれる圧縮のための前処理手法についてストリーム処理を可能とするアルゴリズムを開発した.これらの新しいアルゴリズムを開発できたことで,今後の応用の実現へ大きく前進したと考えられる.

Strategy for Future Research Activity

当初予定していなかった新しい成果が生まれている.まず,Re-Pairと呼ばれる非常に圧縮率がよいことで知られているが作業効率が悪いアルゴリズムに対し,再圧縮と呼ばれる手法を応用して,これまでにない省スペースなアルゴリズムを開発した.また,文字列を秘匿して比較する手法を応用してセキュリティに配慮した情報検索を可能にするシステムを開発した.また,圧縮データから機械学習する予備的な実験を始めている.これらの成果を本研究の最終目標へつなげるように新しい研究テーマを模索していく.

  • Research Products

    (4 results)

All 2019 2018

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] A faster implementation of online RLBWT and its application to LZ77 parsing2018

    • Author(s)
      Tatsuya Ohno, Kensuke Sakai, Yoshimasa Takabatake, Tomohiro I, Hiroshi Sakamoto
    • Journal Title

      J. Discrete Algorithms

      Volume: 52-53 Pages: 18-28

    • DOI

      https://doi.org/10.1016/j.jda.2018.11.002

    • Peer Reviewed / Open Access
  • [Journal Article] LZ-ABT: A Practical Algorithm for α-Balanced Grammar Compression2018

    • Author(s)
      Tatsuya Ohno, Keisuke Goto, Yoshimasa Takabatake, Tomohiro I, Hiroshi Sakamoto
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 10979 Pages: 323-335

    • Peer Reviewed
  • [Journal Article] Privacy-Preserving String Edit Distance with Moves2018

    • Author(s)
      Shunta Nakagawa, Tokio Sakamoto, Yoshimasa Takabatake, Tomohiro I, Kilho Shin, Hiroshi Sakamoto
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 11223 Pages: 226-240

    • Peer Reviewed
  • [Presentation] RePair in Compressed Space and Time2019

    • Author(s)
      Kensuke Sakai, Tatsuya Ohno, Keisuke Goto, Yoshimasa Takabatake, Tomohiro I, Hiroshi Sakamoto
    • Organizer
      Data Compression Conference 2019
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi