2020 Fiscal Year Annual Research Report
Project/Area Number |
20H04141
|
Research Institution | Tokyo Medical and Dental University |
Principal Investigator |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
|
Co-Investigator(Kenkyū-buntansha) |
井 智弘 九州工業大学, 大学院情報工学研究院, 准教授 (20773360)
関 新之助 電気通信大学, 大学院情報理工学研究科, 准教授 (30624944)
稲永 俊介 九州大学, システム情報科学研究院, 准教授 (60448404)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | Lyndon 語 / Lyndon 木 / 原始平方 / 文字列アトラクタ |
Outline of Annual Research Achievements |
本年度の主な成果は以下の通りである。1) 辞書式順序によって定義される Lyndon 語と Lyndon木に基づいた Lyndon SLPという文法圧縮表現および圧縮索引構造を提案した。この索引は長さ N のテキスト文字列に対して O(N log N) 期待時間で構築でき、長さ m のパターン文字列のテキスト文字列中の全ての出現をO(m+log m log N + occ log g) 時間で出力することができる。ここで、occ はパターンの出現数、g はLyndon SLP のサイズである。2) 長さ N の文字列に含まれる原始平方の出現の最大数について、Lyndon 語と Lyndon木に基づいた議論により N log N 以下であることを示し、20年以上前に[Fraenkel & Simpson, 1999] によって示された上界 1.441 N log N を初めてかつ大幅に改善することに成功した。また、三つの平方が同一位置で始まる場合に、それらの長さに関する制約を捉えた「三平方の補題」について、Lyndon 語に基づく別の証明を与え、同一位置で始まらない場合にも拡張できることを示した。3) Thue-Morse語という文字列のクラスに対し、辞書式圧縮に関連する幾つかの圧縮指標の値を詳細に解析した。具体的には、n 番目 Thue-Morse 語 t(n) の: LZ77分解のサイズは 2n, 部分文字列複雑性に基づく指標δは 10/(3+2^{4-n})、最小文字列アトラクタのサイズ γ は 4 であることを示した。これにより、t(n) の最小文字列アトラクタサイズ γ は nであるという [Mantaci et al. 2019] の予想を否定的に解決した。また、この成果は国際会議 SPIRE 2020 にて発表し、ベストペーパー賞を受賞した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コロナウィルスの感染拡大により、国際会議等における研究ディスカッションや共同研究の打ち合わせなどが想定より制限された面もあるが、取り組んだ課題で一定の成果が得られているため、順調と考えられる。
|
Strategy for Future Research Activity |
引き続き課題として挙げている問題に取り組むとともに、新しい課題についても適宜開拓してく。
|
Research Products
(19 results)
-
-
-
-
-
-
-
-
-
-
[Journal Article] On Repetitiveness Measures of Thue-Morse Words2020
Author(s)
Kanaru Kutsukake, Takuya Matsumoto, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
Proceedings of the 27th International Symposium on String Processing and Information Retrieval (SPIRE 2020)
Volume: LNCS 12303
Pages: 213-220
DOI
Peer Reviewed
-
-
-
-
-
-
-
-
-