研究課題/領域番号 |
25280086
|
研究種目 |
基盤研究(B)
|
研究機関 | 九州大学 |
研究代表者 |
坂内 英夫 九州大学, システム情報科学研究科(研究院, 准教授 (20323644)
|
研究分担者 |
稲永 俊介 九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 圧縮文字列処理 / SLP / LZ 分解 |
研究概要 |
本年度は主に直線的プログラム (Straight Line Program - SLP) という文字列の圧縮表現を対象にし,様々な問題について圧縮表現を陽に展開する事なく,効率良く処理するアルゴリズムの開発に取り組み,以下の成果が得られた. 1) 圧縮表現された文字列の繰り返し構造発見問題に対して,これまでは連続して2回出現する部分文字列 (square) が存在するかどうかを検出するアルゴリズムしか存在しなかったが,本研究ではより一般化した極大繰り返し構造 (run) の検出、更には数え上げを行う初の多項式時間アルゴリズムを提案した.2) 圧縮表現された文字列の Lyndon 分解を求める問題に対して、初の多項式時間アルゴリズムを提案した.また,文字列の Lyndon 分解のサイズがその文字列を表現する任意の SLP のサイズの下界であるという理論的に興味深い知見が得られた.3) 圧縮表現された文字列の LZ78 分解を求めるアルゴリズムについて,これまで O(n sqrt{N} + m log N) 時間のアルゴリズムが知られていたが、本研究では O(n + m log m) 時間のアルゴリズムが得られた.ここで, n は SLP のサイズ, m は LZ78 分解のサイズ,N は SLP が表現する非圧縮文字列の長さである. 更に,与えられた文字列を表現する小さな SLP を得るために重要な LZ77 分解問題に関して,高速かつ省領域なアルゴリズムの開発を行った.本研究では、アルファベットサイズ σ が小さいときに、線形時間で動作する LZ77 分解アルゴリズムの中で最も省領域となる N log N + O(σ log N) ビット領域で動作するアルゴリズムの開発に成功した.また,新しい文字が次々に追加されるオンライン LZ77 分解問題に対して,O(N log σ) ビット領域のみを使用したアルゴリズムの中で最も高速となる O(N log N) 時間アルゴリズムを開発する事に成功した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
極大繰り返し構造の発見・列挙アルゴリズムの開発に成功したのをはじめ,幾つかの重要な文字列処理問題に対して圧縮文字列処理のアプローチの導入を行う事ができており,順調に研究が進んでいると言える.
|
今後の研究の推進方策 |
研究の進捗は順調であり、これまで通りに進めるとともに、今後は実際のデータへの適用を視野に入れた検討を行う.
|
次年度の研究費の使用計画 |
本年度は成果が多く出たため、成果発表の予算を優先した.残額では十分な性能の計算機の購入が難しいため、翌年度の予算と合わせて購入することとした。 計算機実験等に使用するための計算機を購入する。
|