• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

文字列圧縮と組合せ論による大規模データ管理・処理技法の開発

研究課題

研究課題/領域番号 18F18120
研究機関九州大学

研究代表者

稲永 俊介  九州大学, システム情報科学研究院, 准教授 (60448404)

研究分担者 KOEPPL DOMINIK  九州大学, システム情報科学研究院, 外国人特別研究員
研究期間 (年度) 2018-10-12 – 2021-03-31
キーワードアルゴリズム / データ構造 / 文字列データ処理
研究実績の概要

本研究では,外国人特別研究員 Dominik Koeppl 博士(ドイツ)を中心メンバーとして,以下の研究分野における研究開発を行った.(a) 可逆圧縮アルゴリズム,(b) 文字列データ構造,(c) 文字列組み合わせ論.
分野 (a) について,Koeppl 氏の先行研究で提案されている lcpcomp というテキスト圧縮アルゴリズムの改善に取り組んだ.lcpcomp は,辞書式順序に整列した接尾辞列の最長共通接頭辞を利用する圧縮法で,圧縮は速いが展開に時間が掛かることが知られている.本研究では,シンプルなアルゴリズムで展開できる新圧縮技法 uni-lcpcomp を開発した.また,lcpcomp が自己参照を許すのに対し,自己参照を避ける non-overlapping lcpcomp を考案した.
分野 (b) について,レジスタ長を有効活用したパック化索引構造を提案した.Z-fast trie, および Takagi らのパック化索引構造などと比較して,理論・実際の両面でより高速であることを確認した.また,全単射 BW 変換文字列に対する索引構造を提案した.
分野 (c) について,最短唯一部分文字列 (Shortest Unique Substring, SUS) を求めるクエリに高速応答する簡潔データ構造の開発に着手した.この研究成果自体は,分野 (b) に属するものであるが,SUS に内在する組み合わせ的性質を解明・利用することにより,データ構造の冗長性を削除し,省領域なデータ構造の開発へと繋げていくものである.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

Dominik Koeppl 博士は,2018年9月半ばに来日して以降,研究室の学生ゼミに積極的に参加しつつ,自らの研究テーマにおいても優れた研究成果を達成している.その内容は前述した研究実績の概要の通りである.特に,(c) 全単射 BW 変換文字列に対する索引構造については,当該分野の第1線で活躍する研究者が集う国際会議(査読付き会議録有り)に採択されている.今後も,質・量ともに当初の計画を上回る成果が期待される.

今後の研究の推進方策

【現在までの進捗状況】で述べたように,これまでに,当初の計画以上の研究成果が得られている.今後も,このままの体制・方針で研究開発を行っていく予定である.

  • 研究成果

    (3件)

すべて 2019 その他

すべて 国際共同研究 (2件) 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 オープンアクセス 1件)

  • [国際共同研究] Nicolaus Copernicus University(ポーランド)

    • 国名
      ポーランド
    • 外国機関名
      Nicolaus Copernicus University
  • [国際共同研究] University of Helsinki(フィンランド)

    • 国名
      フィンランド
    • 外国機関名
      University of Helsinki
  • [雑誌論文] Indexing the Bijective BWT2019

    • 著者名/発表者名
      Hideo Bannai, Juha Karkkainen, Dominik Koeppl and Marcin Piatkowski
    • 雑誌名

      Proc. 30th Annual Symposium on Combinatorial Pattern Matching (CPM 2019)

      巻: to appear ページ: to appear

    • 査読あり / オープンアクセス / 国際共著

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi