2018 Fiscal Year Annual Research Report
文字列圧縮と組合せ論による大規模データ管理・処理技法の開発
Project/Area Number |
18F18120
|
Research Institution | Kyushu University |
Principal Investigator |
稲永 俊介 九州大学, システム情報科学研究院, 准教授 (60448404)
|
Co-Investigator(Kenkyū-buntansha) |
KOEPPL DOMINIK 九州大学, システム情報科学研究院, 外国人特別研究員
|
Project Period (FY) |
2018-10-12 – 2021-03-31
|
Keywords | アルゴリズム / データ構造 / 文字列データ処理 |
Outline of Annual Research Achievements |
本研究では,外国人特別研究員 Dominik Koeppl 博士(ドイツ)を中心メンバーとして,以下の研究分野における研究開発を行った.(a) 可逆圧縮アルゴリズム,(b) 文字列データ構造,(c) 文字列組み合わせ論. 分野 (a) について,Koeppl 氏の先行研究で提案されている lcpcomp というテキスト圧縮アルゴリズムの改善に取り組んだ.lcpcomp は,辞書式順序に整列した接尾辞列の最長共通接頭辞を利用する圧縮法で,圧縮は速いが展開に時間が掛かることが知られている.本研究では,シンプルなアルゴリズムで展開できる新圧縮技法 uni-lcpcomp を開発した.また,lcpcomp が自己参照を許すのに対し,自己参照を避ける non-overlapping lcpcomp を考案した. 分野 (b) について,レジスタ長を有効活用したパック化索引構造を提案した.Z-fast trie, および Takagi らのパック化索引構造などと比較して,理論・実際の両面でより高速であることを確認した.また,全単射 BW 変換文字列に対する索引構造を提案した. 分野 (c) について,最短唯一部分文字列 (Shortest Unique Substring, SUS) を求めるクエリに高速応答する簡潔データ構造の開発に着手した.この研究成果自体は,分野 (b) に属するものであるが,SUS に内在する組み合わせ的性質を解明・利用することにより,データ構造の冗長性を削除し,省領域なデータ構造の開発へと繋げていくものである.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
Dominik Koeppl 博士は,2018年9月半ばに来日して以降,研究室の学生ゼミに積極的に参加しつつ,自らの研究テーマにおいても優れた研究成果を達成している.その内容は前述した研究実績の概要の通りである.特に,(c) 全単射 BW 変換文字列に対する索引構造については,当該分野の第1線で活躍する研究者が集う国際会議(査読付き会議録有り)に採択されている.今後も,質・量ともに当初の計画を上回る成果が期待される.
|
Strategy for Future Research Activity |
【現在までの進捗状況】で述べたように,これまでに,当初の計画以上の研究成果が得られている.今後も,このままの体制・方針で研究開発を行っていく予定である.
|
-
-
-
[Journal Article] Indexing the Bijective BWT2019
Author(s)
Hideo Bannai, Juha Karkkainen, Dominik Koeppl and Marcin Piatkowski
-
Journal Title
Proc. 30th Annual Symposium on Combinatorial Pattern Matching (CPM 2019)
Volume: to appear
Pages: to appear
Peer Reviewed / Open Access / Int'l Joint Research