• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

最先端文字列アルゴリズム理論に基づく巨大データ解析技法

研究課題

研究課題/領域番号 20J11983
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
審査区分 小区分60010:情報学基礎論関連
研究機関北海道大学 (2021)
九州大学 (2020)

研究代表者

三重野 琢也  北海道大学, 情報科学研究院, 博士研究員

研究期間 (年度) 2020-04-24 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
1,700千円 (直接経費: 1,700千円)
2021年度: 800千円 (直接経費: 800千円)
2020年度: 900千円 (直接経費: 900千円)
キーワード文字列アルゴリズム / 回文 / 文字列圧縮
研究開始時の研究の概要

本研究では,文字列データ処理のあらゆる問題について劣線形 (sublinear) 領域のデータ構造を考案・実装することで,巨大な入力データに対して実用的なデータ処理手法を提案する.特に,文字列中に一度しか出現しない部分文字列 (unique substring) について着目し,その組合せ的性質を利用した省領域なデータ構造を考案する.さらに,文字列構造に対する最先端の理論を応用することで,大規模かつ非定型なデータを対象とした新たな知識発見基盤を開発する.

研究実績の概要

前から読んでも後ろから読んでも同じ文字列を回文という。文字列から回文構造を発見する問題は特に生物情報科学の分野で重要視され、盛んに研究されている。
本研究期間においては、文字列中の回文構造を効率よく検出するためのデータ構造・アルゴリズムの開発を主として行った。他にも文字列圧縮アルゴリズムの性能に関する研究などを行い、以下の6つの成果を得た。
1つ目の成果は、入力文字列に対して特定の編集操作が許された設定において、ユニーク回文部分文字列を計算するアルゴリズムの提案である。ユニーク回文部分文字列とは、文字列中にちょうど一度だけ出現する回文である。本成果は国際会議 SPIRE 2021 に採択されており、さらにその結果を応用した研究成果は国際会議 IWOCA 2022 に投稿された。
2つ目の成果は、双方向マクロスキームと呼ばれる文字列圧縮形式に対する圧縮性能限界の解明である。3つ目の成果は、LZEnd 圧縮と呼ばれる文字列圧縮手法の圧縮性能に関する新たな結果の証明である。文字列圧縮手法の性能を比較・解析する研究は文字列圧縮研究の分野で近年盛んに行われており、特に2つ目の成果は同分野で注目されていた未解決問題のひとつを解決したものである。2つ目と3つ目の成果は国際会議 SPIRE 2021 に採択されている。
4つ目の成果は、RePair という文字列圧縮手法の圧縮性能に関する新たな結果の証明である。5つ目の成果は、デカルト木部分列照合問題と呼ばれる緩和された部分列照合問題に対するアルゴリズムの提案である。6つ目の成果は、圧縮表現された文字列上で、その文字列中に存在しない不在文字列を計算するアルゴリズムの提案である。上記3つの成果はいずれも国際会議 CPM 2022 に採択されている。

現在までの達成度 (段落)

令和3年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和3年度が最終年度であるため、記入しない。

報告書

(2件)
  • 2021 実績報告書
  • 2020 実績報告書
  • 研究成果

    (11件)

すべて 2022 2021 2020

すべて 雑誌論文 (3件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 2件) 学会発表 (8件) (うち国際学会 8件)

  • [雑誌論文] Palindromic trees for a sliding window and its applications2022

    • 著者名/発表者名
      Takuya Mieno, Kiichi Watanabe, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Information Processing Letters

      巻: 173 ページ: 106174-106174

    • DOI

      10.1016/j.ipl.2021.106174

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Computing Minimal Unique Substrings for a Sliding Window2021

    • 著者名/発表者名
      Takuya Mieno, Yuta Fujishige, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Algorithmica

      巻: 84 号: 3 ページ: 670-693

    • DOI

      10.1007/s00453-021-00864-1

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Space-efficient algorithms for computing minimal/shortest unique substrings2020

    • 著者名/発表者名
      Mieno Takuya, Koppl Dominik, Nakashima Yuto, Inenaga Shunsuke, Bannai Hideo, Takeda Masayuki
    • 雑誌名

      Theoretical Computer Science

      巻: 845 ページ: 230-242

    • DOI

      10.1016/j.tcs.2020.09.017

    • 関連する報告書
      2020 実績報告書
    • 査読あり / 国際共著
  • [学会発表] Cartesian Tree Subsequence Matching2022

    • 著者名/発表者名
      Tsubasa Oizumi, Takeshi Kai, Takuya Mieno, Shunsuke Inenaga, Hiroki Arimura
    • 学会等名
      33rd Annual Symposium on Combinatorial Pattern Matching (CPM 2022)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] RePair Grammars are the Smallest Grammars for Fibonacci Words2022

    • 著者名/発表者名
      Takuya Mieno, Shunsuke Inenaga, Takashi Horiyama
    • 学会等名
      33rd Annual Symposium on Combinatorial Pattern Matching (CPM 2022)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Minimal Absent Words on Run-Length Encoded Strings2022

    • 著者名/発表者名
      Tooru Akagi, Kouta Okabe, Takuya Mieno, Yuto Nakashima, Shunsuke Inenaga
    • 学会等名
      33rd Annual Symposium on Combinatorial Pattern Matching (CPM 2022)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Minimal unique palindromic substrings after single-character substitution2021

    • 著者名/発表者名
      Mitsuru Funakoshi, Takuya Mieno
    • 学会等名
      28th International Symposium on String Processing and Information Retrieval (SPIRE 2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] On the approximation ratio of LZ-End to LZ772021

    • 著者名/発表者名
      Takumi Ideue, Takuya Mieno, Mitsuru Funakoshi, Yuto Nakashima, Shunsuke Inenaga, Masayuki Takeda
    • 学会等名
      28th International Symposium on String Processing and Information Retrieval (SPIRE 2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] A separation of γ and b via Thue-Morse Words2021

    • 著者名/発表者名
      Hideo Bannai, Mitsuru Funakoshi, Tomohiro I, Dominik Koeppl, Takuya Mieno, Takaaki Nishimoto
    • 学会等名
      28th International Symposium on String Processing and Information Retrieval (SPIRE 2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] String Sanitization Under Edit Distance: Improved and Generalized2021

    • 著者名/発表者名
      Takuya Mieno, Solon P. Pissis, Leen Stougie, Michelle Sweering
    • 学会等名
      32nd Annual Symposium on Combinatorial Pattern Matching (CPM 2021)
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Lyndon Words, the Three Squares Lemma, and Primitive Squares2020

    • 著者名/発表者名
      Hideo Bannai, Takuya Mieno, Yuto Nakashima
    • 学会等名
      27th International Symposium on String Processing and Information Retrieval (SPIRE 2020)
    • 関連する報告書
      2020 実績報告書
    • 国際学会

URL: 

公開日: 2020-07-07   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi