研究課題
文字列とは,記号の連鎖のことである.コンピュータ上で取り扱うデータの多くは,文字列とみなすことができる.そのため,文字列データを高速かつ省領域で処理する基盤技術の開発は,情報爆発時代における喫緊の課題となっている.近年,爆発的に増加した非構造データの集まりを俗にビッグデータと呼ぶようになり,ビッグデータの省領域な格納方法,および有効な活用方法の開発に注目が集まっている.本研究では,データに内在する冗長性を削除し,データの記述長を短縮するデータ圧縮技術を活用する.特に,直線的プログラム(Straight Line Program, SLP)と呼ばれる,単一の文字列のみを導出するチョムスキー標準形の文脈自由文法でデータを圧縮表現する方法に着目した.SLP のサイズを n としたとき,展開文字列長が n に対して指数的に大きくなる場合が存在する.したがって,入力 SLP を陽に展開することなく,様々な処理を n の多項式時間で行うアルゴリズムは,大規模データの省領域な格納と,高速な検索・知識発見に有用である.今年度は主に,以下の高度な処理を入力 SLP サイズ n の多項式時間で行う手法を開発した.(1) SLP 圧縮文字列が反復文字列(squares)を含むかどうかの判定,(2) SLP 圧縮文字列から LZ78 分解への変換,(3) SLP 圧縮文字列と非圧縮パターンの畳み込みの計算,(4) SLP 圧縮文字列中の全 q グラムの出現頻度の計算.
1: 当初の計画以上に進展している
H23年度は,回文照合問題という新たな問題を提案し,それを最適時間で解くアルゴリズムを開発した.また,パラメタ化文字列照合との密接な関係性を明らかにした.また,H24年度には,研究実績の概要の欄でも述べたとおり,SLP で圧縮表現された文字列に対して,様々な処理を高速かつ省領域で行う技術の開発に立て続けに成功しており,当初の計画を上回るものとなっている.
今後は,研究実績の概要で述べたアルゴリズムのさらなる高速化・省領域化に取り組む.また,より高度な処理を行うことができるように改良を重ねていく予定である.
提案手法のさらなる高速化・省領域化の実現ために,当該分野の第一線で活躍する研究者が集う会議に積極的に参加し,最新の研究成果を網羅するとともに,新技術開発のためのディスカッションを行う.このため,国際会議参加や研究打ち合わせを目的として,数度の海外出張を予定している.また,東北大学の共同研究グループとの研究打ち合わせや,国内の会議への参加も積極的に行う予定である.研究成果をまとめるために,計算機や周辺機器の購入も適宜行う予定である.
すべて 2013 2012 その他
すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (6件) 備考 (2件)
In Proc. The 39th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2013), Lecture Notes in Computer Science, (Springer-Verlag)
巻: 7741 ページ: 280-291
10.1007/978-3-642-35843-2_25
Journal of Discrete Algorithms
巻: 18 ページ: 89-99
10.1016/j.jda.2012.07.006
Proc. Data Compression Conference 2013 (DCC 2013)
ページ: 451-460
ページ: 143-152
Information Processing Letters
巻: 122(9) ページ: 711-714
10.1016/j.ipl.2012.06.017
In Proc. the 19th Symposium on String Processing and Information Retrieval (SPIRE 2012), Lecture Notes in Computer Science, (Springer-Verlag)
巻: 7608 ページ: 360-371
10.1007/978-3-642-34109-0_38
巻: 7608 ページ: 86-98
10.1007/978-3-642-34109-0_10
In Proc. the 23rd Annual Symposium on Combinatorial Pattern Matching (CPM 2012), Lecture Notes in Computer Science, (Springer-Verlag)
巻: 7354 ページ: 220-231
10.1007/978-3-642-31265-6_18
http://str.i.kyushu-u.ac.jp/~inenaga/index-j.html
http://hyoka.ofc.kyushu-u.ac.jp/search/details/K003385/index.html