研究課題/領域番号 |
20H04141
|
研究機関 | 東京医科歯科大学 |
研究代表者 |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
|
研究分担者 |
井 智弘 九州工業大学, 大学院情報工学研究院, 准教授 (20773360)
関 新之助 電気通信大学, 大学院情報理工学研究科, 准教授 (30624944)
稲永 俊介 九州大学, システム情報科学研究院, 准教授 (60448404)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | Lyndon 語 / Lyndon 木 / 原始平方 / 文字列アトラクタ |
研究実績の概要 |
本年度の主な成果は以下の通りである。1) 辞書式順序によって定義される Lyndon 語と Lyndon木に基づいた Lyndon SLPという文法圧縮表現および圧縮索引構造を提案した。この索引は長さ N のテキスト文字列に対して O(N log N) 期待時間で構築でき、長さ m のパターン文字列のテキスト文字列中の全ての出現をO(m+log m log N + occ log g) 時間で出力することができる。ここで、occ はパターンの出現数、g はLyndon SLP のサイズである。2) 長さ N の文字列に含まれる原始平方の出現の最大数について、Lyndon 語と Lyndon木に基づいた議論により N log N 以下であることを示し、20年以上前に[Fraenkel & Simpson, 1999] によって示された上界 1.441 N log N を初めてかつ大幅に改善することに成功した。また、三つの平方が同一位置で始まる場合に、それらの長さに関する制約を捉えた「三平方の補題」について、Lyndon 語に基づく別の証明を与え、同一位置で始まらない場合にも拡張できることを示した。3) Thue-Morse語という文字列のクラスに対し、辞書式圧縮に関連する幾つかの圧縮指標の値を詳細に解析した。具体的には、n 番目 Thue-Morse 語 t(n) の: LZ77分解のサイズは 2n, 部分文字列複雑性に基づく指標δは 10/(3+2^{4-n})、最小文字列アトラクタのサイズ γ は 4 であることを示した。これにより、t(n) の最小文字列アトラクタサイズ γ は nであるという [Mantaci et al. 2019] の予想を否定的に解決した。また、この成果は国際会議 SPIRE 2020 にて発表し、ベストペーパー賞を受賞した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
コロナウィルスの感染拡大により、国際会議等における研究ディスカッションや共同研究の打ち合わせなどが想定より制限された面もあるが、取り組んだ課題で一定の成果が得られているため、順調と考えられる。
|
今後の研究の推進方策 |
引き続き課題として挙げている問題に取り組むとともに、新しい課題についても適宜開拓してく。
|