研究課題/領域番号 |
21K17705
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 九州大学 |
研究代表者 |
中島 祐人 九州大学, システム情報科学研究院, 助教 (80804682)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 文字列組合せ論 / 文字列アルゴリズム / 文字列圧縮 / 文字列処理アルゴリズム |
研究開始時の研究の概要 |
文字列データを対象としたデータ圧縮においては,辞書式圧縮と呼ばれる様々な手法が知られている.一般に,部分文字列の反復(繰り返し)が多いほど,文字列は圧縮されやすい傾向にあるため,LZ 分解などの文字列構造のサイズは,文字列の反復性を捉えた反復性指標と見なすことができる.最近では,String attractor や部分文字列複雑性に基づいた反復性指標が提案され,反復性への理解が進められているが,本申請課題では,辞書式圧縮とは直接関係のない Lyndon 文字列および関連する文字列構造を導入することで,新たな視点から反復性指標の解析を行い,その本質を明らかにする.
|
研究実績の概要 |
文字列データの圧縮や,圧縮された文字列データを圧縮サイズに依存した計算量でデータ処理を行う技術は,重要な文字列処理技術の一つであり,これまでに非常に多く研究がなされている.特に,繰り返し構造を多く含む(高反復な)文字列に対して有用な辞書式圧縮や関連する様々な圧縮法が,どの程度文字列中の繰り返し構造を捉えているかを明らかにするため,様々な辞書式圧縮法に基づいた反復性指標に関する理論的な解析が注目を集めている.本研究課題は,文字列の圧縮と直接的に関係のない Lyndon 文字列や関連する文字列構造との関係を導入および明らかにすることで,文字列の反復性をどのように捉えることができるかという問いに挑戦する課題である.また,これらの知見を利用することで様々な問題に対する文字列アルゴリズムの開発に取り組むことを目的としている.
3年目にあたる2023年度では,査読付き国際会議に6報の研究成果を発表済みである. 本研究課題に最も深く関係する成果として,(1)反復分解の組合せ的性質に関する成果および,(2)最適LZ-End分解の計算困難性に関する成果が挙げられる.(1) 反復とは,ある文字列の2回以上の有理数回の繰り返しで表される文字列のことを指す.本研究では,フィボナッチ文字列に対する項数最大反復分解のサイズに関する未解決問題を解決に導いた.文字列の反復性について追求する本研究課題において有用な知見を与えている.(2) LZ-End分解とは,代表的な辞書式圧縮法であるLZ分解の派生であり,部分文字列へのランダムアクセスにおいて優れた性能を持つ圧縮法である.本研究では,与えられた文字列に対する項数最小LZ-End分解の計算する問題がNP困難であることを示した.また,貪欲法により得られるあるLZ-End分解の項数と最適LZ-End分解の項数の比について理論的解析を行い,非自明な下界も与えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究実績の概要で説明したように,分野の中心的な国際会議において十分な成果を発表できている.また,2023年度中には発表できなかった成果もある.発表に向けて鋭意準備中であることから,本研究課題はおおむね順調に進展していると考えている.
|
今後の研究の推進方策 |
引き続き,研究計画に基づいて研究を推し進める予定である.最終年度であるため,国内外での成果発表をより積極的に行う.
|