2013 Fiscal Year Annual Research Report
Project/Area Number |
25280086
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Kyushu University |
Principal Investigator |
坂内 英夫 九州大学, システム情報科学研究科(研究院, 准教授 (20323644)
|
Co-Investigator(Kenkyū-buntansha) |
稲永 俊介 九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 圧縮文字列処理 / SLP / LZ 分解 |
Research Abstract |
本年度は主に直線的プログラム (Straight Line Program - SLP) という文字列の圧縮表現を対象にし,様々な問題について圧縮表現を陽に展開する事なく,効率良く処理するアルゴリズムの開発に取り組み,以下の成果が得られた. 1) 圧縮表現された文字列の繰り返し構造発見問題に対して,これまでは連続して2回出現する部分文字列 (square) が存在するかどうかを検出するアルゴリズムしか存在しなかったが,本研究ではより一般化した極大繰り返し構造 (run) の検出、更には数え上げを行う初の多項式時間アルゴリズムを提案した.2) 圧縮表現された文字列の Lyndon 分解を求める問題に対して、初の多項式時間アルゴリズムを提案した.また,文字列の Lyndon 分解のサイズがその文字列を表現する任意の SLP のサイズの下界であるという理論的に興味深い知見が得られた.3) 圧縮表現された文字列の LZ78 分解を求めるアルゴリズムについて,これまで O(n sqrt{N} + m log N) 時間のアルゴリズムが知られていたが、本研究では O(n + m log m) 時間のアルゴリズムが得られた.ここで, n は SLP のサイズ, m は LZ78 分解のサイズ,N は SLP が表現する非圧縮文字列の長さである. 更に,与えられた文字列を表現する小さな SLP を得るために重要な LZ77 分解問題に関して,高速かつ省領域なアルゴリズムの開発を行った.本研究では、アルファベットサイズ σ が小さいときに、線形時間で動作する LZ77 分解アルゴリズムの中で最も省領域となる N log N + O(σ log N) ビット領域で動作するアルゴリズムの開発に成功した.また,新しい文字が次々に追加されるオンライン LZ77 分解問題に対して,O(N log σ) ビット領域のみを使用したアルゴリズムの中で最も高速となる O(N log N) 時間アルゴリズムを開発する事に成功した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
極大繰り返し構造の発見・列挙アルゴリズムの開発に成功したのをはじめ,幾つかの重要な文字列処理問題に対して圧縮文字列処理のアプローチの導入を行う事ができており,順調に研究が進んでいると言える.
|
Strategy for Future Research Activity |
研究の進捗は順調であり、これまで通りに進めるとともに、今後は実際のデータへの適用を視野に入れた検討を行う.
|
Expenditure Plans for the Next FY Research Funding |
本年度は成果が多く出たため、成果発表の予算を優先した.残額では十分な性能の計算機の購入が難しいため、翌年度の予算と合わせて購入することとした。 計算機実験等に使用するための計算機を購入する。
|
-
-
-
-
-
-
-
[Journal Article] Detecting regularities on grammar-compressed strings2013
Author(s)
Tomohiro I, Wataru Matsubara, Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda, Kazuyuki Narisawa, Ayumi Shinohara
-
Journal Title
Proc. 38th International Symposium on Mathematical Foundations of Computer Science (MFCS 2013)
Volume: LNCS 8087
Pages: 571-582
DOI
Peer Reviewed
-
-
-
-
-