Project/Area Number |
21K17705
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Kyushu University |
Principal Investigator |
中島 祐人 九州大学, システム情報科学研究院, 助教 (80804682)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2021: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | 文字列組合せ論 / 文字列アルゴリズム / 文字列圧縮 / 文字列処理アルゴリズム |
Outline of Research at the Start |
文字列データを対象としたデータ圧縮においては,辞書式圧縮と呼ばれる様々な手法が知られている.一般に,部分文字列の反復(繰り返し)が多いほど,文字列は圧縮されやすい傾向にあるため,LZ 分解などの文字列構造のサイズは,文字列の反復性を捉えた反復性指標と見なすことができる.最近では,String attractor や部分文字列複雑性に基づいた反復性指標が提案され,反復性への理解が進められているが,本申請課題では,辞書式圧縮とは直接関係のない Lyndon 文字列および関連する文字列構造を導入することで,新たな視点から反復性指標の解析を行い,その本質を明らかにする.
|
Outline of Annual Research Achievements |
文字列データの圧縮や,圧縮された文字列データを圧縮サイズに依存した計算量で何らかの処理を行う技術は,重要な文字列処理技術の一つであり,これまでに非常に多く研究がなされている.特に,繰り返し構造を多く含む文字列に対して有用な辞書式圧縮や関連する様々な圧縮法が,どの程度文字列中の繰り返し構造を捉えているかを明らかにするため,様々な圧縮法に基づいた反復性指標に関する理論的な解析が注目を集めている.本研究課題は,文字列の圧縮と直接的に関係のない Lyndon 文字列や関連する文字列構造との関係を導入および明らかにすることで,文字列の反復性をどのように捉えることができるかという問いに挑戦する課題である.また,これらの知見を利用することで様々な問題に対する文字列アルゴリズムの開発を推し進める. 2年目にあたる2022年度では,査読付き国際ジャーナルに4報,査読付き国際会議に2報の研究成果を発表済みである.うち3報が文字列組合せ論に関する成果であり,うち4報が文字列アルゴリズムおよびデータ構造に関する成果をまとめたものである.本研究課題に最も深く関係する成果として,反復分解のアルゴリズムおよび組合せ的性質に関する成果が挙げられる.ここでの反復とは,テキスト中の部分文字列のうち,ある文字列の2回以上の有理数回の繰り返しで表される文字列のことを指す.本成果では,テキストの最大および最小サイズの反復分解を高速に計算するアルゴリズムに加え,そのような反復分解に関する組合せ的性質についてフィボナッチ文字列を用いて議論を行っている.特に後者の成果については,文字列の反復性について追求する本研究課題において有用な知見を与えていると考えられる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要で説明したように,分野で注目される査読付き国際会議において十分な成果を発表できている.また,2022年度中には発表できなかった成果もある.発表に向けて鋭意準備中であることから,本研究課題はおおむね順調に進展していると考えている.
|
Strategy for Future Research Activity |
引き続き,研究計画に基づいて研究を推し進める予定である.
|
Report
(2 results)
Research Products
(29 results)
-
-
-
-
-
-
-
[Journal Article] Counting Lyndon Subsequence2021
Author(s)
Ryo Hirakawa, Yuto Nakashima, Shunsuke Inenaga, Masayuki Takeda
-
Journal Title
Proceedings of the Prague Stringology Conference 2021
Volume: -
Pages: 53-60
Related Report
Peer Reviewed / Open Access
-
-
[Journal Article] On the Approximation Ratio of LZ-End to LZ772021
Author(s)
Takumi Ideue, Takuya Mieno, Mitsuru Funakoshi, Yuto Nakashima, Shunsuke Inenaga, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 114-126
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed
-
[Journal Article] Grammar Index by Induced Suffix Sorting2021
Author(s)
Tooru Akagi, Dominik Koeppl, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 85-99
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed / Int'l Joint Research
-
[Journal Article] Longest Common Rollercoasters2021
Author(s)
Kosuke Fujita, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
Proceedings of 28th International Symposium on String Processing and Information Retrieval
Volume: 12944
Pages: 21-32
DOI
ISBN
9783030866914, 9783030866921
Related Report
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Longest Common Rollercoasters2021
Author(s)
Kosuke Fujita, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
Organizer
28th International Symposium on String Processing and Information Retrieval
Related Report
Int'l Joint Research