• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文字列圧縮と組合せ論による大規模データ管理・処理技法の開発

研究課題

研究課題/領域番号 18F18120
研究種目

特別研究員奨励費

配分区分補助金
応募区分外国
研究分野 情報学基礎理論
研究機関東京医科歯科大学 (2020)
九州大学 (2018-2019)

研究代表者

稲永 俊介 (2018-2019)  九州大学, システム情報科学研究院, 准教授 (60448404)

研究分担者 Koeppl Dominik  東京医科歯科大学, M&Dデータ科学センター, 助教 (50897395)
KOEPPL DOMINIK  九州大学, システム情報科学研究院, 外国人特別研究員
研究期間 (年度) 2018-10-12 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
1,400千円 (直接経費: 1,400千円)
2020年度: 400千円 (直接経費: 400千円)
2019年度: 600千円 (直接経費: 600千円)
2018年度: 400千円 (直接経費: 400千円)
キーワードdata structures / algorithms / lossless compression / hashing / アルゴリズム / データ構造 / 文字列データ処理 / tries / text indexing
研究実績の概要

The focus of this research was set on (a) practical and dynamic trie data structures, (b) the computation of the grammar compression Re-Pair in small space, and (c) advancements for the bijective Burrows-Wheeler transform (BBWT), a variant of the Burrows-Wheeler transform (BWT) well received in theory as well as in practice for indexing string data.
(a) We have devised a novel approach for compact hashing, which is the most memory-efficient approach in practice when working with a huge number of integer keys of a bounded domain. Based on this approach, we have proposed dynamic trie data structures working with path-decomposition or with trie compaction.
(b) Re-Pair, a grammar with high compression ratios, is difficult to compute within limited amount of memory. Here, we could find a quadratic time algorithm computing Re-Pair with almost no additional space. We also devised an index data structure build upon a grammar representing the Lyndon tree. This index exploits several properties of the Lyndon words to improve the running time of the currently fastest grammar index from a quadratic factor on the pattern length to a linear one.
(c) Finally, we could build an indexing data structure on top of the BBWT, compute the BBWT in-place or transform the BWT into the BBWT, and finally build the BBWT in linear time.
Asides from that, we could find space-efficient factorization algorithms for the non-overlapping LZ77 factorization and the LZ78 substring compression problem. These algorithms work in near-linear time with space asymptotic to the input text length in bits.

現在までの達成度 (段落)

令和2年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和2年度が最終年度であるため、記入しない。

報告書

(3件)
  • 2020 実績報告書
  • 2019 実績報告書
  • 2018 実績報告書
  • 研究成果

    (43件)

すべて 2021 2020 2019 その他

すべて 国際共同研究 (11件) 雑誌論文 (18件) (うち国際共著 17件、 査読あり 18件、 オープンアクセス 9件) 学会発表 (12件) (うち国際学会 8件、 招待講演 1件) 備考 (2件)

  • [国際共同研究] TU Dortmund/German Aerospace Center/Universitaet Stuttgart(ドイツ)

    • 関連する報告書
      2020 実績報告書
  • [国際共同研究] Dalhousie University(カナダ)

    • 関連する報告書
      2020 実績報告書
  • [国際共同研究] University of Leicester/Aberystwyth University(英国)

    • 関連する報告書
      2020 実績報告書
  • [国際共同研究] University of Helsinki(フィンランド)

    • 関連する報告書
      2020 実績報告書
  • [国際共同研究] University of Chile(チリ)

    • 関連する報告書
      2020 実績報告書
  • [国際共同研究] TU Dortmund/Goethe University Frankfurt(ドイツ)

    • 関連する報告書
      2019 実績報告書
  • [国際共同研究] Helsinki University(フィンランド)

    • 関連する報告書
      2019 実績報告書
  • [国際共同研究] Nicolaus Copernicus University(ポーランド)

    • 関連する報告書
      2019 実績報告書
  • [国際共同研究] University of Leicester(英国)

    • 関連する報告書
      2019 実績報告書
  • [国際共同研究] Nicolaus Copernicus University(ポーランド)

    • 関連する報告書
      2018 実績報告書
  • [国際共同研究] University of Helsinki(フィンランド)

    • 関連する報告書
      2018 実績報告書
  • [雑誌論文] PHONI: Streamed Matching Statistics with Multi-Genome References2021

    • 著者名/発表者名
      Christina Boucher and Travis Gagie and Tomohiro I and Dominik Koeppl and Ben Langmead and Giovanni Manzini and Gonzalo Navarro and Alejandro Pacheco and Massimiliano Rossi
    • 雑誌名

      Proc. DCC

      巻: -

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Non-Overlapping LZ77 Factorization and LZ78 Substring Compression Queries with Suffix Trees2021

    • 著者名/発表者名
      Dominik Koeppl
    • 雑誌名

      Algorithms

      巻: 14(2) 号: 2 ページ: 44-44

    • DOI

      10.3390/a14020044

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Fast and Simple Compact Hashing via Bucketing2020

    • 著者名/発表者名
      Dominik Koeppl and Simon J. Puglisi and Rajeev Raman
    • 雑誌名

      Proc. SEA in LIPIcs

      巻: 160

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl and Tomohiro I and Isamu Furuya and Yoshimasa Takabatake and Kensuke Sakai and Keisuke Goto
    • 雑誌名

      Proc. PSC

      巻: -

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Re-Pair in Small Space (Poster)2020

    • 著者名/発表者名
      Dominik Koeppl and Tomohiro I and Isamu Furuya and Yoshimasa Takabatake and Kensuke Sakai and Keisuke Goto
    • 雑誌名

      Proc. DCC

      巻: - ページ: 377-377

    • DOI

      10.1109/dcc47342.2020.00092

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] c-Trie++: A Dynamic Trie Tailored for Fast Prefix Searches2020

    • 著者名/発表者名
      Tsuruta Kazuya, Koppl Dominik, Kanda Shunsuke, Nakashima Yuto, Inenaga Shunsuke, Bannai Hideo, Takeda Masayuki
    • 雑誌名

      Proceedings of Data Compression Conference 2020

      巻: 1 ページ: 243-252

    • DOI

      10.1109/dcc47342.2020.00032

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Computational Aspects of Ordered Integer Partition with Bounds2020

    • 著者名/発表者名
      Roland Glueck and Dominik Koeppl
    • 雑誌名

      Algorithmica

      巻: 82 号: 10 ページ: 2955-2984

    • DOI

      10.1007/s00453-020-00713-7

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] In-Place Bijective Burrows--Wheeler Transforms2020

    • 著者名/発表者名
      Dominik Koeppl and Daiki Hashimoto and Diptarama Hendrian and Ayumi Shinohara
    • 雑誌名

      Proc. CPM in LIPIcs

      巻: 161

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Deterministic Sparse Suffix Sorting in the Restore Model2020

    • 著者名/発表者名
      Johannes Fischer, Tomohiro I, Dominik Koeppl
    • 雑誌名

      ACM Transactions on Algorithms

      巻: 16(4) 号: 4 ページ: 1-53

    • DOI

      10.1145/3398681

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Grammar-compressed Self-index with Lyndon Words2020

    • 著者名/発表者名
      Kazuya Tsuruta and Dominik Koeppl and Yuto Nakashima and Shunsuke Inenaga and Hideo Bannai and Masayuki Takeda
    • 雑誌名

      IPSJ TOM

      巻: 13

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Dynamic Path-Decomposed Tries2020

    • 著者名/発表者名
      Shunsuke Kanda and Dominik Koeppl and Yasuo Tabei and Kazuhiro Morita and Masao Fuketa
    • 雑誌名

      ACM JEA

      巻: 25 ページ: 1-28

    • DOI

      10.1145/3418033

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Space-efficient algorithms for computing minimal/shortest unique substrings2020

    • 著者名/発表者名
      Mieno Takuya, Koppl Dominik, Nakashima Yuto, Inenaga Shunsuke, Bannai Hideo, Takeda Masayuki
    • 雑誌名

      Theoretical Computer Science

      巻: 845 ページ: 230-242

    • DOI

      10.1016/j.tcs.2020.09.017

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] On Arithmetically Progressed Suffix Arrays2020

    • 著者名/発表者名
      Jacqueline W. Daykin and Dominik Koeppl and David Kuebel and Florian Stober
    • 雑誌名

      Proc. PSC

      巻: -

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl, Tomohiro I, Isamu Furuya, Yoshimasa Takabatake, Kensuke Sakai, Keisuke Goto,
    • 雑誌名

      Algorithms

      巻: 14(1) 号: 1 ページ: 1-20

    • DOI

      10.3390/a14010005

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Indexing the Bijective BWT2019

    • 著者名/発表者名
      Hideo Bannai, Juha Karkkainen, Dominik Koeppl, Marcin Piatkowski
    • 雑誌名

      Proceedings of the 30th Annual Symposium on Combinatorial Pattern Matching (CPM 2019)

      巻: LIPIcs 128

    • DOI

      10.4230/LIPICS.CPM.2019.17

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Bidirectional Text Compression in External Memory2019

    • 著者名/発表者名
      Patrick Dinklage, Jonas Ellert, Johannes Fischer, Dominik Koeppl, Manuel Penschuck
    • 雑誌名

      Proceedings of the 27th Annual European Symposium on Algorithms - ESA 2019

      巻: 144 in LIPIcs series

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Compact data structure for shortest unique substring queries2019

    • 著者名/発表者名
      Takuya Mieno, Dominik Koeppl, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of 26th International Symposium on String Processing and Information Retrieval, Lecture Notes in Computer Science

      巻: 11811 ページ: 107-123

    • DOI

      10.1007/978-3-030-32686-9_8

    • ISBN
      9783030326852, 9783030326869
    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Indexing the Bijective BWT2019

    • 著者名/発表者名
      Hideo Bannai, Juha Karkkainen, Dominik Koeppl and Marcin Piatkowski
    • 雑誌名

      Proc. 30th Annual Symposium on Combinatorial Pattern Matching (CPM 2019)

      巻: to appear

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] PHONI: Streamed Matching Statistics with Multi-Genome References2021

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      DCC
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Fast and Simple Compact Hashing via Bucketing2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      SEA
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      PSC
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] c-Trie++: A Dynamic Trie Tailored for Fast Prefix Searches2020

    • 著者名/発表者名
      Kazuya Tsuruta and Dominik Koeppl
    • 学会等名
      DCC
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] In-Place Bijective Burrows--Wheeler Transforms2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      CPM
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Constructing the Bijective BWT2020

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      The 28th London Stringology Days & London Algorithmic Workshop - LAWS&LSD 2020
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] In-Place Bijective Burrows Wheeler Transformations2020

    • 著者名/発表者名
      Dominik Koeppl, Daiki Hashimoto, Diptarama Hendrian and Ayumi Shinohara
    • 学会等名
      Data Structures in Bioinformatics workshop - DSB2020
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Constructing the Bijective BWT2019

    • 著者名/発表者名
      Hideo Bannai, Juha Karkkainen, Dominik Koeppl, Marcin Piatkowski
    • 学会等名
      175th アルゴリズム研究会, 2019
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Dominik Koeppl, 井 智弘, 古谷 勇, 高畠 嘉将, 酒井 健輔, 後藤 啓介2019

    • 著者名/発表者名
      Re-Pair In-Place
    • 学会等名
      LA Symposium Summer 2019
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Separate Chaining Meets Compact Hashing2019

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      173th アルゴリズム研究会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Dynamic Trie Tailored for Fast Prefix Searches2019

    • 著者名/発表者名
      鶴田 和弥, Dominik Koeppl, 神田 峻介, 中島 祐人, 稲永 俊介, 坂内 英夫, 竹田 正幸
    • 学会等名
      LA Symposium Summer 2019
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Searching Patterns in the Bijective BWT2019

    • 著者名/発表者名
      Dominik Koeppl
    • 学会等名
      Dagstuhl Seminar 19241 "25 Years of the Burrows-Wheeler Transform
    • 関連する報告書
      2019 実績報告書
    • 国際学会 / 招待講演
  • [備考] personal homepage

    • URL

      https://dkppl.de/

    • 関連する報告書
      2020 実績報告書
  • [備考] Homepage of Dominik Koeppl

    • URL

      https://dkppl.de/

    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2018-10-15   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi