• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ストリームデータのための圧縮索引と知識発見への応用

研究課題

研究課題/領域番号 17H06954
研究種目

研究活動スタート支援

配分区分補助金
研究分野 知能情報学
研究機関九州工業大学

研究代表者

高畠 嘉将  九州工業大学, 大学院情報工学研究院, 特任助教 (20807010)

研究期間 (年度) 2017-08-25 – 2019-03-31
研究課題ステータス 完了 (2017年度)
配分額 *注記
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード文法圧縮 / 圧縮索引 / オンラインアルゴリズム / 文法圧縮索引 / 知識発見
研究実績の概要

本研究ではネットワークやセンサデータからとめどなく流れてきて増え続けるデータであるストリーム型のテキストデータを圧縮領域の作業領域で圧縮しながら,その圧縮データ上で圧縮された瞬間からリアルタイムにキーワード検索可能な索引を構築することを目的としている.
この問題は①ストリームデータを流れてきた瞬間に高速に圧縮領域の作業領域で小さく圧縮することと②その圧縮されたデータ構造上でリアルタイムにキーワード検索することに分けられ,以下の成果を得られた.
①に関して,①の要件を満たしかつ世界最小の作業領域で動作する文法圧縮であるSOLCAを開発し,ESA2017という国際会議にて研究発表をした.実用的にSOLCAは従来の圧縮領域の作業領域で構築可能な文法圧縮の速度を保ったまま,30%程度のメモリ使用量で動作することを可能としている.さらに①の要件を満たす圧縮領域で構築可能なOnline RLBWTと呼ばれるテキストデータ圧縮の高速化をして,IWOCA2017という国際会議にて研究発表した.従来手法より作業領域が1.3から8.7倍かかってしまったが,約60倍の速度で圧縮可能にしており,実用的である.
②に関してはキーワード検索ではないが,SOLCAの圧縮法を応用した入力テキスト中に2度以上出現する部分文字列の一部分を高速に圧縮領域で発見する方法を論文誌(IEICE Transactions on Information and Systems)に採択されました.また,以前開発したESP-index-Iという圧縮索引の短いキーワードの検索手法の高速化を行い,DCC2018にて研究発表しました.
SOLCAとOnline RLBWTの構築の効率化によって,これらの圧縮法を②の要件を満たす圧縮索引に発展させることが今後の課題である.

現在までの達成度 (段落)

29年度が最終年度であるため、記入しない。

今後の研究の推進方策

29年度が最終年度であるため、記入しない。

報告書

(1件)
  • 2017 実績報告書
  • 研究成果

    (4件)

すべて 2018 2017

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 3件)

  • [雑誌論文] Approximate Frequent Pattern Discovery in Compressed Space2018

    • 著者名/発表者名
      Shouhei FUKUNAGA, Yoshimasa TAKABATAKE, Tomohiro I, Hiroshi SAKAMOTO
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E101.D 号: 3 ページ: 593-601

    • DOI

      10.1587/transinf.2017FCP0010

    • NAID

      130006414054

    • ISSN
      0916-8532, 1745-1361
    • 関連する報告書
      2017 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] A Dynamic Compressed Self-Index for Highly Repetitive Text Collections2018

    • 著者名/発表者名
      Takaaki Nishimoto, Yoshimasa Takabatake, Yasuo Tabei
    • 学会等名
      Data Compression Conference 2018
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] A Space-Optimal Grammar Compression2017

    • 著者名/発表者名
      Yoshimasa Takabatake, Tomohiro I, Hiroshi Sakamoto
    • 学会等名
      25th Annual European Symposium on Algorithms
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] A Faster Implementation of Online Run-Length Burrows-Wheeler Transform2017

    • 著者名/発表者名
      Tatsuya Ohno, Yoshimasa Takabatake, Tomohiro I, Hiroshi Sakamoto
    • 学会等名
      28th International Workshop on Combinatorial Algorithms
    • 関連する報告書
      2017 実績報告書
    • 国際学会

URL: 

公開日: 2017-08-25   更新日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi