2023 年度実績報告書

文字列の辞書式順序の組合せ論とその応用

研究課題

研究課題/領域番号	20H04141
研究機関	東京医科歯科大学
研究代表者	坂内英夫東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
研究分担者	井智弘九州工業大学, 大学院情報工学研究院, 准教授 (20773360) 関新之助電気通信大学, 大学院情報理工学研究科, 准教授 (30624944) 稲永俊介九州大学, システム情報科学研究院, 教授 (60448404)
研究期間 (年度)	2020-04-01 – 2024-03-31
キーワード	Lyndon 語 / Lyndon 配列 / 辞書式圧縮 / FM-index
研究実績の概要	本年度の主な成果は以下のとおりである。 1) 入力文字列長 n, アルファベットサイズσ とする時、入力の表現長 n log σ ビットに対して計算機のワード長 log n ビットを定数時間で処理できることを利用し、文字列の各位置から始まる最長 Lyndon 語の長さ、すなわち文字列のLyndon 木・配列の表現をO(n logσ/log n) の劣線形時間で計算できるアルゴリズムを示した。2) 最小 LZ-End 圧縮問題、最小連長圧縮 SLP (RLSP) 問題および最小コラージュシステム問題の３つの辞書式圧縮の問題がNP 完全であることを示した。また、LZ-End と RLSLP については MAX-SAT による定式化を示し、高速なMAX-SAT ソルバを利用することである程度の長さの文字列について現実的な時間で計算できることを示した。3) 与えられた文字列に部分列として含まれる最長の Lyndon 語を求める問題に関し、文字列の各接頭辞に対して順にこれを計算するオンラインな設定において、昨年度得られていたO(n^3σ) 時間・領域のアルゴリズムをO(n^3) 時間・領域に改善できることを示した。4) Prefix-free parsing を FM-index に組み入れる手法を提案した。Prefix-free parsing で文字列をフレーズに分割し、その性質を利用することでフレーズ単位の検索を行うことが可能となり、従来法と比べてデータ構造のサイズをさほど大きくすることなく、特に長い検索クエリを高速化できることを示した。
現在までの達成度 (段落)	令和5年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和5年度が最終年度であるため、記入しない。

研究成果
(18件)

すべて 2024 2023 その他

すべて国際共同研究 (4件) 雑誌論文 (9件) (うち国際共著 5件、査読あり 9件、オープンアクセス 5件) 学会発表 (5件) (うち国際学会 5件)

[国際共同研究] Dalhousie University(カナダ)
- 国名
  カナダ
- 外国機関名
  Dalhousie University
[国際共同研究] Technical University of Dortmund/Munster University(ドイツ)
- 国名
  ドイツ
- 外国機関名
  Technical University of Dortmund/Munster University
[国際共同研究] University of Florida(米国)
- 国名
  米国
- 外国機関名
  University of Florida
[国際共同研究] University of Helsinki(フィンランド)
- 国名
  フィンランド
- 外国機関名
  University of Helsinki
[雑誌論文] Pfp-fm: an accelerated FM-index2024
- 著者名/発表者名
  Hong Aaron、Oliva Marco、Koppl Dominik、Bannai Hideo、Boucher Christina、Gagie Travis
- 雑誌名
  
  Algorithms for Molecular Biology
  
  巻: 19 ページ: -
- DOI
  10.1186/s13015-024-00260-8
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] On the Hardness of Smallest RLSLPs and Collage Systems2024
- 著者名/発表者名
  Kawamoto Akiyoshi、I Tomohiro、Koppl Dominik、Bannai Hideo
- 雑誌名
  
  Proceedings of the Data Compression Conference 2024 (DCC 2024)
  
  巻: - ページ: 243-252
- DOI
  10.1109/DCC58796.2024.00032
- 査読あり
[雑誌論文] Acceleration of FM-Index Queries Through Prefix-Free Parsing2023
- 著者名/発表者名
  Aaron Hong, Marco Oliva, Dominik Koppl, Hideo Bannai, Christina Boucher, Travis Gagie
- 雑誌名
  
  Proceedings of the 23rd International Workshop on Algorithms in Bioinformatics (WABI 2023)
  
  巻: - ページ: 13:1-13:16
- DOI
  10.4230/LIPIcs.WABI.2023.13
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Linear-Time Computation of Generalized Minimal Absent Words for Multiple Strings2023
- 著者名/発表者名
  Okabe Kouta、Mieno Takuya、Nakashima Yuto、Inenaga Shunsuke、Bannai Hideo
- 雑誌名
  
  Proceedings of the 30th International Symposium on String Processing and Information Retrieval (SPIRE 2023)
  
  巻: - ページ: 331～344
- DOI
  10.1007/978-3-031-43980-3_27
- 査読あり
[雑誌論文] Lyndon Arrays in Sublinear Time2023
- 著者名/発表者名
  Hideo Bannai, Jonas Ellert
- 雑誌名
  
  Proceedings of the 31st Annual European Symposium on Algorithms (ESA 2023)
  
  巻: - ページ: 14:1-14:16
- DOI
  10.4230/LIPIcs.ESA.2023.14
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Optimal LZ-End Parsing Is Hard2023
- 著者名/発表者名
  Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
- 雑誌名
  
  Proceedings of the 34th Annual Symposium on Combinatorial Pattern Matching (CPM 2023)
  
  巻: - ページ: 3:1-3:11
- DOI
  10.4230/LIPIcs.CPM.2023.3
- 査読あり / オープンアクセス
[雑誌論文] Linear-time computation of DAWGs, symmetric indexing structures, and MAWs for integer alphabets2023
- 著者名/発表者名
  Fujishige Yuta、Tsujimaru Yuki、Inenaga Shunsuke、Bannai Hideo、Takeda Masayuki
- 雑誌名
  
  Theoretical Computer Science
  
  巻: 973 ページ: 114093～114093
- DOI
  10.1016/j.tcs.2023.114093
- 査読あり
[雑誌論文] Longest bordered and periodic subsequences2023
- 著者名/発表者名
  Bannai Hideo、I Tomohiro、Koppl Dominik
- 雑誌名
  
  Information Processing Letters
  
  巻: 182 ページ: 106398～106398
- DOI
  10.1016/j.ipl.2023.106398
- 査読あり / 国際共著
[雑誌論文] Computing Longest Lyndon Subsequences and Longest Common Lyndon Subsequences2023
- 著者名/発表者名
  Bannai Hideo、I. Tomohiro、Kociumaka Tomasz、Koppl Dominik、Puglisi Simon J.
- 雑誌名
  
  Algorithmica
  
  巻: 86 ページ: 735～756
- DOI
  10.1007/s00453-023-01125-z
- 査読あり / オープンアクセス / 国際共著
[学会発表] On the Hardness of Smallest RLSLPs and Collage Systems2024
- 著者名/発表者名
  Kawamoto Akiyoshi、I Tomohiro、Koppl Dominik、Bannai Hideo
- 学会等名
  Data Compression Conference 2024 (DCC 2024)
- 国際学会
[学会発表] Acceleration of FM-Index Queries Through Prefix-Free Parsing2023
- 著者名/発表者名
  Aaron Hong, Marco Oliva, Dominik Koppl, Hideo Bannai, Christina Boucher, Travis Gagie
- 学会等名
  23rd International Workshop on Algorithms in Bioinformatics (WABI 2023)
- 国際学会
[学会発表] Linear-Time Computation of Generalized Minimal Absent Words for Multiple Strings2023
- 著者名/発表者名
  Okabe Kouta、Mieno Takuya、Nakashima Yuto、Inenaga Shunsuke、Bannai Hideo
- 学会等名
  30th International Symposium on String Processing and Information Retrieval (SPIRE 2023)
- 国際学会
[学会発表] Lyndon Arrays in Sublinear Time2023
- 著者名/発表者名
  Hideo Bannai, Jonas Ellert
- 学会等名
  31st Annual European Symposium on Algorithms (ESA 2023)
- 国際学会
[学会発表] Optimal LZ-End Parsing Is Hard2023
- 著者名/発表者名
  Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
- 学会等名
  34th Annual Symposium on Combinatorial Pattern Matching (CPM 2023)
- 国際学会

2023 年度 実績報告書

文字列の辞書式順序の組合せ論とその応用

研究代表者

坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)

研究成果

[国際共同研究] Dalhousie University(カナダ)

国名

外国機関名

[国際共同研究] Technical University of Dortmund/Munster University(ドイツ)

国名

外国機関名

[国際共同研究] University of Florida(米国)

国名

外国機関名

[国際共同研究] University of Helsinki(フィンランド)

国名

外国機関名

[雑誌論文] Pfp-fm: an accelerated FM-index2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] On the Hardness of Smallest RLSLPs and Collage Systems2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] Acceleration of FM-Index Queries Through Prefix-Free Parsing2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Linear-Time Computation of Generalized Minimal Absent Words for Multiple Strings2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Lyndon Arrays in Sublinear Time2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Optimal LZ-End Parsing Is Hard2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Linear-time computation of DAWGs, symmetric indexing structures, and MAWs for integer alphabets2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Longest bordered and periodic subsequences2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Computing Longest Lyndon Subsequences and Longest Common Lyndon Subsequences2023

著者名/発表者名

雑誌名

DOI

[学会発表] On the Hardness of Smallest RLSLPs and Collage Systems2024

著者名/発表者名

学会等名

[学会発表] Acceleration of FM-Index Queries Through Prefix-Free Parsing2023

著者名/発表者名

学会等名

[学会発表] Linear-Time Computation of Generalized Minimal Absent Words for Multiple Strings2023

著者名/発表者名

学会等名

[学会発表] Lyndon Arrays in Sublinear Time2023

著者名/発表者名

学会等名

[学会発表] Optimal LZ-End Parsing Is Hard2023

著者名/発表者名

学会等名

2023 年度実績報告書

坂内英夫東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)