2009 Fiscal Year Annual Research Report
Project/Area Number |
21700019
|
Research Institution | Kyushu University |
Principal Investigator |
稲永 俊介 Kyushu University, 大学院・システム情報科学研究院, 特任准教授 (60448404)
|
Keywords | アルゴリズム / データ構造 / 文字列照合 |
Research Abstract |
記憶媒体の低価格化やネットワークの高速化を背景として,計算機可読なデータ(文字列データ)が爆発的な速度で増加している.本研究では,パラメタ化文字列照合問題を高速かつ省領域で解くアルゴリズムとパラメタ化パタン発見システムの開発を行う.文字列pを文字列sに変換する文字の一対一写像が存在するとき,文字列pとsはパラメタ化合致するという.パラメタ化文字列照合問題とは,パタン文字列pとテキスト文字列tが与えられたとき,pがt中でパラメタ化合致する位置の集合を求める問題である.高速なパラメタ化文字列照合技法によって,ソフトウェアメンテナンスや盗作検出,RNAの2次構造照合などの効率化が期待できる. 本年度は,パラメタ化接尾辞配列とパラメタ化LCP配列の高速構築アルゴリズムを開発した.これらの配列を用いることにより,パラメタ化文字列照合問題をO(m+logn+|Occ|))時間で解くことができる.ここで,mはパタン文字列pの長さ,nはテキスト文字列tの長さ,Occはpがt中でパラメタ化合致する位置の集合である.提案手法が既存手法よりも高速にパラメタ化接尾辞配列とパラメタ化LCP配列を構築することを計算機実験によって確かめた. また,与えられた整数列をパラメタ化ボーダ配列として持つ文字列を出力する問題(逆問題)をアルファベットサイズが2のときに線形時間で解くアルゴリズムを開発した.パラメタ化ボーダ配列を用いることにより,パラメタ化文字列照合問題をO(n+|Occ|)時間で解くことができる.本研究では,逆問題を解くことによって,パラメタ化ボーダ配列の組み合わせ的性質を明らかにした.
|