Project/Area Number |
21K17705
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Kyushu University |
Principal Investigator |
中島 祐人 九州大学, システム情報科学研究院, 助教 (80804682)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2021: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | 文字列組合せ論 / 文字列アルゴリズム / 文字列圧縮 / 文字列処理アルゴリズム |
Outline of Research at the Start |
文字列データを対象としたデータ圧縮においては,辞書式圧縮と呼ばれる様々な手法が知られている.一般に,部分文字列の反復(繰り返し)が多いほど,文字列は圧縮されやすい傾向にあるため,LZ 分解などの文字列構造のサイズは,文字列の反復性を捉えた反復性指標と見なすことができる.最近では,String attractor や部分文字列複雑性に基づいた反復性指標が提案され,反復性への理解が進められているが,本申請課題では,辞書式圧縮とは直接関係のない Lyndon 文字列および関連する文字列構造を導入することで,新たな視点から反復性指標の解析を行い,その本質を明らかにする.
|
Outline of Annual Research Achievements |
文字列データの圧縮や,圧縮された文字列データを圧縮サイズに依存した計算量でデータ処理を行う技術は,重要な文字列処理技術の一つであり,これまでに非常に多く研究がなされている.特に,繰り返し構造を多く含む(高反復な)文字列に対して有用な辞書式圧縮や関連する様々な圧縮法が,どの程度文字列中の繰り返し構造を捉えているかを明らかにするため,様々な辞書式圧縮法に基づいた反復性指標に関する理論的な解析が注目を集めている.本研究課題は,文字列の圧縮と直接的に関係のない Lyndon 文字列や関連する文字列構造との関係を導入および明らかにすることで,文字列の反復性をどのように捉えることができるかという問いに挑戦する課題である.また,これらの知見を利用することで様々な問題に対する文字列アルゴリズムの開発に取り組むことを目的としている.
3年目にあたる2023年度では,査読付き国際会議に6報の研究成果を発表済みである. 本研究課題に最も深く関係する成果として,(1)反復分解の組合せ的性質に関する成果および,(2)最適LZ-End分解の計算困難性に関する成果が挙げられる.(1) 反復とは,ある文字列の2回以上の有理数回の繰り返しで表される文字列のことを指す.本研究では,フィボナッチ文字列に対する項数最大反復分解のサイズに関する未解決問題を解決に導いた.文字列の反復性について追求する本研究課題において有用な知見を与えている.(2) LZ-End分解とは,代表的な辞書式圧縮法であるLZ分解の派生であり,部分文字列へのランダムアクセスにおいて優れた性能を持つ圧縮法である.本研究では,与えられた文字列に対する項数最小LZ-End分解の計算する問題がNP困難であることを示した.また,貪欲法により得られるあるLZ-End分解の項数と最適LZ-End分解の項数の比について理論的解析を行い,非自明な下界も与えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要で説明したように,分野の中心的な国際会議において十分な成果を発表できている.また,2023年度中には発表できなかった成果もある.発表に向けて鋭意準備中であることから,本研究課題はおおむね順調に進展していると考えている.
|
Strategy for Future Research Activity |
引き続き,研究計画に基づいて研究を推し進める予定である.最終年度であるため,国内外での成果発表をより積極的に行う.
|
Report
(3 results)
Research Products
(48 results)
-
-
[Journal Article] Optimal LZ-End Parsing is Hard2023
Author(s)
Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
-
Journal Title
Proceedings of 34th Annual Symposium on Combinatorial Pattern Matching
Volume: LIPIcs 259
Related Report
Peer Reviewed / Open Access
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] Counting Lyndon Subsequence2021
Author(s)
Ryo Hirakawa, Yuto Nakashima, Shunsuke Inenaga, Masayuki Takeda
-
Journal Title
Proceedings of the Prague Stringology Conference 2021
Volume: -
Pages: 53-60
Related Report
Peer Reviewed / Open Access
-
-
[Journal Article] On the Approximation Ratio of LZ-End to LZ772021
Author(s)
Takumi Ideue, Takuya Mieno, Mitsuru Funakoshi, Yuto Nakashima, Shunsuke Inenaga, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 114-126
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed
-
[Journal Article] Grammar Index by Induced Suffix Sorting2021
Author(s)
Tooru Akagi, Dominik Koeppl, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 85-99
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed / Int'l Joint Research
-
[Journal Article] Longest Common Rollercoasters2021
Author(s)
Kosuke Fujita, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 21-32
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed
-
-
[Presentation] Optimal LZ-End Parsing is Hard2023
Author(s)
Hideo Bannai, Mitsuru Funakoshi, Kazuhiro Kurita, Yuto Nakashima, Kazuhisa Seto, Takeaki Uno
Organizer
34th Annual Symposium on Combinatorial Pattern Matching
Related Report
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Longest Common Rollercoasters2021
Author(s)
Kosuke Fujita, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
Organizer
28th International Symposium on String Processing and Information Retrieval
Related Report
Int'l Joint Research