2023 Fiscal Year Annual Research Report
Project/Area Number |
20H04141
|
Research Institution | Tokyo Medical and Dental University |
Principal Investigator |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
|
Co-Investigator(Kenkyū-buntansha) |
井 智弘 九州工業大学, 大学院情報工学研究院, 准教授 (20773360)
関 新之助 電気通信大学, 大学院情報理工学研究科, 准教授 (30624944)
稲永 俊介 九州大学, システム情報科学研究院, 教授 (60448404)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | Lyndon 語 / Lyndon 配列 / 辞書式圧縮 / FM-index |
Outline of Annual Research Achievements |
本年度の主な成果は以下のとおりである。 1) 入力文字列長 n, アルファベットサイズσ とする時、入力の表現長 n log σ ビットに対して計算機のワード長 log n ビットを定数時間で処理できることを利用し、文字列の各位置から始まる最長 Lyndon 語の長さ、すなわち文字列のLyndon 木・配列の表現をO(n logσ/log n) の劣線形時間で計算できるアルゴリズムを示した。2) 最小 LZ-End 圧縮問題、最小連長圧縮 SLP (RLSP) 問題および最小コラージュシステム問題の3つの辞書式圧縮の問題がNP 完全であることを示した。また、LZ-End と RLSLP については MAX-SAT による定式化を示し、高速なMAX-SAT ソルバを利用することである程度の長さの文字列について現実的な時間で計算できることを示した。3) 与えられた文字列に部分列として含まれる最長の Lyndon 語を求める問題に関し、文字列の各接頭辞に対して順にこれを計算するオンラインな設定において、昨年度得られていたO(n^3σ) 時間・領域のアルゴリズムをO(n^3) 時間・領域に改善できることを示した。4) Prefix-free parsing を FM-index に組み入れる手法を提案した。Prefix-free parsing で文字列をフレーズに分割し、その性質を利用することでフレーズ単位の検索を行うことが可能となり、従来法と比べてデータ構造のサイズをさほど大きくすることなく、特に長い検索クエリを高速化できることを示した。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
-
[Journal Article] Optimal LZ-End Parsing Is Hard2023
Author(s)
Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
-
Journal Title
Proceedings of the 34th Annual Symposium on Combinatorial Pattern Matching (CPM 2023)
Volume: -
Pages: 3:1-3:11
DOI
Peer Reviewed / Open Access
-
-
-
-
-
-
-
-
[Presentation] Optimal LZ-End Parsing Is Hard2023
Author(s)
Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
Organizer
34th Annual Symposium on Combinatorial Pattern Matching (CPM 2023)
Int'l Joint Research