Budget Amount *help |
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 2011: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2009: ¥700,000 (Direct Cost: ¥700,000)
|
Research Abstract |
本研究では,データ圧縮を単に保存領域の削減にとどまらず,処理の効率化を目指して,圧縮文字列のための文字列アルゴリズムの開発を行った.とりわけ,文字列の繰り返し構造に着目し,圧縮文字列から繰り返し構造を検出するアルゴリズムの開発を目指して研究を行った. ひとつに,繰り返し構造に込められた制約をより明確にするために,繰り返し構造から,もとの文字列を推測するという逆問題に取り組んだ.本年度は,繰り返し構造の中でも局所周期に着目して逆問題に取り組み,部分的な成果を得た.結果として,計算複雑性がアルファベットサイズに依存して変化し,アルファベットサイズに制約がない場合か,アルファベットサイズが2以下であるとき,効率良く逆問題を解くアルゴリズムを与えた.アルファベットサイズが3以上の定数である場合の計算複雑性を明らかにすることが今後の課題である.本研究の成果は,学術論文誌Discrete Applied Mathematicsの特集号に投稿済であり,査読中である. ふたつに,圧縮文字列照合について,文字列に含まれる繰り返し構造を求めるアルゴリズムの開発に取り組んだ.既存研究として,圧縮データ長をn,展開文字列長をNとしたとき,繰り返し構造の存在判定を行う0(nlogN)時間アルゴリズムが知られている.本研究では,この結果をベースとして,スクエア(2回繰り返し部分文字列)および連(極大な周期的部分文字列)の個数を求めるアルゴリズムに拡張した.この成果について,国際学会への投稿を準備している.
|