• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

文字列圧縮と組合せ論による大規模データ管理・処理技法の開発

研究課題

研究課題/領域番号 18F18120
研究機関東京医科歯科大学
研究分担者 Koeppl Dominik  東京医科歯科大学, M&Dデータ科学センター, 助教 (50897395)
研究期間 (年度) 2018-10-12 – 2021-03-31
キーワードdata structures / algorithms / lossless compression / hashing / アルゴリズム / データ構造 / 文字列データ処理 / tries
研究実績の概要

The focus of this research was set on (a) practical and dynamic trie data structures, (b) the computation of the grammar compression Re-Pair in small space, and (c) advancements for the bijective Burrows-Wheeler transform (BBWT), a variant of the Burrows-Wheeler transform (BWT) well received in theory as well as in practice for indexing string data.
(a) We have devised a novel approach for compact hashing, which is the most memory-efficient approach in practice when working with a huge number of integer keys of a bounded domain. Based on this approach, we have proposed dynamic trie data structures working with path-decomposition or with trie compaction.
(b) Re-Pair, a grammar with high compression ratios, is difficult to compute within limited amount of memory. Here, we could find a quadratic time algorithm computing Re-Pair with almost no additional space. We also devised an index data structure build upon a grammar representing the Lyndon tree. This index exploits several properties of the Lyndon words to improve the running time of the currently fastest grammar index from a quadratic factor on the pattern length to a linear one.
(c) Finally, we could build an indexing data structure on top of the BBWT, compute the BBWT in-place or transform the BWT into the BBWT, and finally build the BBWT in linear time.
Asides from that, we could find space-efficient factorization algorithms for the non-overlapping LZ77 factorization and the LZ78 substring compression problem. These algorithms work in near-linear time with space asymptotic to the input text length in bits.

現在までの達成度 (段落)

令和2年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和2年度が最終年度であるため、記入しない。

  • 研究成果

    (25件)

すべて 2021 2020 その他

すべて 国際共同研究 (5件) 雑誌論文 (14件) (うち国際共著 14件、 査読あり 14件、 オープンアクセス 6件) 学会発表 (5件) (うち国際学会 5件) 備考 (1件)

  • [国際共同研究] TU Dortmund/German Aerospace Center/Universitaet Stuttgart(ドイツ)

    • 国名
      ドイツ
    • 外国機関名
      TU Dortmund/German Aerospace Center/Universitaet Stuttgart
    • 他の機関数
      1
  • [国際共同研究] Dalhousie University(カナダ)

    • 国名
      カナダ
    • 外国機関名
      Dalhousie University
  • [国際共同研究] University of Leicester/Aberystwyth University(英国)

    • 国名
      英国
    • 外国機関名
      University of Leicester/Aberystwyth University
  • [国際共同研究] University of Helsinki(フィンランド)

    • 国名
      フィンランド
    • 外国機関名
      University of Helsinki
  • [国際共同研究] University of Chile(チリ)

    • 国名
      チリ
    • 外国機関名
      University of Chile
  • [雑誌論文] Re-Pair in Small Space2021

    • 著者名/発表者名
      Dominik Koeppl and Tomohiro I and Isamu Furuya and Yoshimasa Takabatake and Kensuke Sakai and Keisuke Goto
    • 雑誌名

      Algorithms

      巻: 14(1) ページ: 1--20

    • DOI

      10.3390/a14010005

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] PHONI: Streamed Matching Statistics with Multi-Genome References2021

    • 著者名/発表者名
      Christina Boucher and Travis Gagie and Tomohiro I and Dominik Koeppl and Ben Langmead and Giovanni Manzini and Gonzalo Navarro and Alejandro Pacheco and Massimiliano Rossi
    • 雑誌名

      Proc. DCC

      巻: - ページ: 193--202

    • 査読あり / 国際共著
  • [雑誌論文] Non-Overlapping LZ77 Factorization and LZ78 Substring Compression Queries with Suffix Trees2021

    • 著者名/発表者名
      Dominik Koeppl
    • 雑誌名

      Algorithms

      巻: 14(2) ページ: 1--21

    • DOI

      10.3390/a14020044

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Fast and Simple Compact Hashing via Bucketing2020

    • 著者名/発表者名
      Dominik Koeppl and Simon J. Puglisi and Rajeev Raman
    • 雑誌名

      Proc. SEA in LIPIcs

      巻: 160 ページ: 7:1--7:14

    • DOI

      10.4230/LIPIcs.SEA.2020.7

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl and Tomohiro I and Isamu Furuya and Yoshimasa Takabatake and Kensuke Sakai and Keisuke Goto
    • 雑誌名

      Proc. PSC

      巻: - ページ: 134--147

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Re-Pair in Small Space (Poster)2020

    • 著者名/発表者名
      Dominik Koeppl and Tomohiro I and Isamu Furuya and Yoshimasa Takabatake and Kensuke Sakai and Keisuke Goto
    • 雑誌名

      Proc. DCC

      巻: - ページ: 377

    • DOI

      10.1109/DCC47342.2020.00092

    • 査読あり / 国際共著
  • [雑誌論文] c-Trie++: A Dynamic Trie Tailored for Fast Prefix Searches2020

    • 著者名/発表者名
      Kazuya Tsuruta and Dominik Koeppl and Shunsuke Kanda and Yuto Nakashima and Shunsuke Inenaga and Hideo Bannai and Masayuki Takeda
    • 雑誌名

      Proc. DCC

      巻: - ページ: 243--252

    • DOI

      10.1109/DCC47342.2020.00032

    • 査読あり / 国際共著
  • [雑誌論文] Computational Aspects of Ordered Integer Partition with Bounds2020

    • 著者名/発表者名
      Roland Glueck and Dominik Koeppl
    • 雑誌名

      Algorithmica

      巻: 82 ページ: 2955--2984

    • DOI

      10.1007/s00453-020-00713-7

    • 査読あり / 国際共著
  • [雑誌論文] In-Place Bijective Burrows--Wheeler Transforms2020

    • 著者名/発表者名
      Dominik Koeppl and Daiki Hashimoto and Diptarama Hendrian and Ayumi Shinohara
    • 雑誌名

      Proc. CPM in LIPIcs

      巻: 161 ページ: 21:1--21:15

    • DOI

      10.4230/LIPIcs.CPM.2020.21

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Deterministic Sparse Suffix Sorting in the Restore Model2020

    • 著者名/発表者名
      Johannes Fischer and Tomohiro I and Dominik Koeppl
    • 雑誌名

      ACM Trans. Algorithms

      巻: 16 ページ: 50:1--50:53

    • DOI

      10.1145/3398681

    • 査読あり / 国際共著
  • [雑誌論文] Grammar-compressed Self-index with Lyndon Words2020

    • 著者名/発表者名
      Kazuya Tsuruta and Dominik Koeppl and Yuto Nakashima and Shunsuke Inenaga and Hideo Bannai and Masayuki Takeda
    • 雑誌名

      IPSJ TOM

      巻: 13 ページ: 84--92

    • 査読あり / 国際共著
  • [雑誌論文] Dynamic Path-Decomposed Tries2020

    • 著者名/発表者名
      Shunsuke Kanda and Dominik Koeppl and Yasuo Tabei and Kazuhiro Morita and Masao Fuketa
    • 雑誌名

      ACM JEA

      巻: 25 ページ: 1.13:2--1.13:28

    • DOI

      10.1145/3418033

    • 査読あり / 国際共著
  • [雑誌論文] Space-efficient algorithms for computing minimal/shortest unique substrings2020

    • 著者名/発表者名
      Takuya Mieno and Dominik Koeppl and Yuto Nakashima and Shunsuke Inenaga and Hideo Bannai and Masayuki Takeda
    • 雑誌名

      Theor. Comput. Sci.

      巻: 845 ページ: 230--242

    • DOI

      10.1016/j.tcs.2020.09.017

    • 査読あり / 国際共著
  • [雑誌論文] On Arithmetically Progressed Suffix Arrays2020

    • 著者名/発表者名
      Jacqueline W. Daykin and Dominik Koeppl and David Kuebel and Florian Stober
    • 雑誌名

      Proc. PSC

      巻: - ページ: 96--110

    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] PHONI: Streamed Matching Statistics with Multi-Genome References2021

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      DCC
    • 国際学会
  • [学会発表] Fast and Simple Compact Hashing via Bucketing2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      SEA
    • 国際学会
  • [学会発表] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      PSC
    • 国際学会
  • [学会発表] c-Trie++: A Dynamic Trie Tailored for Fast Prefix Searches2020

    • 著者名/発表者名
      Kazuya Tsuruta and Dominik Koeppl
    • 学会等名
      DCC
    • 国際学会
  • [学会発表] In-Place Bijective Burrows--Wheeler Transforms2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      CPM
    • 国際学会
  • [備考] personal homepage

    • URL

      https://dkppl.de/

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi