研究課題/領域番号 |
25280086
|
研究機関 | 九州大学 |
研究代表者 |
坂内 英夫 九州大学, システム情報科学研究科(研究院, 准教授 (20323644)
|
研究分担者 |
稲永 俊介 九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 文法圧縮 / 省領域アルゴリズム |
研究実績の概要 |
本年度の主な成果は以下の通りである。 1) 文字列の圧縮表現の1つである LZ78 分解を計算する問題について、従来のアルゴリズムは整数アルファベットからなる長さ n の文字列に対しては O(nlog n) 時間必要であったが、新たに O(n) 時間で計算するアルゴリズムを考案した。 2) LZ78 分解/圧縮のアイディアを一般化した LZD (LZ-double) と呼ばれる新しい文法圧縮アルゴリズムを提案した。LZ78 分解が以前に出現する最長の項を見出し、それに続く1文字との連接を新たな項にするのに対し、LZD は以前に出現する最長の項を見出した後、それに続く以前に出現する最長の項を再度見出し、それらの連接を新たな項にするものである。本研究では LZD 計算のための効率の良いアルゴリズムを考案し、更に計算機実験により既存の文法圧縮アルゴリズムと比較して、特に近年増加している高反復文字列に対して、圧縮率が良いこと、また、高速かつ省領域で動作することを示した。 3) 文字列の任意の位置の組に対して、それらの位置で始まる最長の共通部分文字列を求める LCE クエリ問題は文字列処理における基本問題である。従来の劣線形領域アルゴリズムでは長さ n の文字列に対して前処理に O(n^2) 時間必要であった。本研究では前処理時間を大幅に改善し、任意のパラメータ 1≦τ≦n に対して,O(nτ) 時間の前処理で O(n/τ) 領域のデータ構造を構築し、任意の LCE クエリに O(τmin {log τ,log n/τ}) 時間で答える手法を考案した。提案アルゴリズムは使用領域とクエリ時間のトレードオフが最適に近いアルゴリズムの中で、大規模データに対して実用的に使える可能性がある初めての劣線形領域アルゴリズムとなる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度の成果の発展として成果が幾つか得られ,順調に研究が進んでいると言える。
|
今後の研究の推進方策 |
研究の進捗は順調であり、これまで通りに進める。
|
次年度使用額が生じた理由 |
6月末に開催される国際会議に本研究の研究成果が受理されたことにより、旅費及び参加費が必要となるため。
|
次年度使用額の使用計画 |
6月末に開催される国際会議に参加し、研究発表を行うための参加費及び旅費に使用する。
|