研究概要 |
計算生物学において極めて重要なClosest文子列問題を解く新しい固定パラメータアルゴリズムを設計した.このアルゴリズムは以前の2-stringアプローチを拡張することによって得られた3-stringアプローチに基づいている.直感的に,2-stringアプローチで入力文字列から2つを選んで探索を始めていくのに対し,3-stringアプローチでは入力文字列から3つを選んで探索を始めていく.この新しいアルゴリズムは入力文字列のアルファベットのサイズが小さいときに,以前のアルゴリズムより高速である.たとえば,文字列のサイズが2であるとき(すなわち,2進列のとき),以前のアルゴリズムはnL+nd・8^d時間を必要とするのに対し,新しいアルゴリズムはnL+nd^3・6.731^d時間を必要とする.ここで,nは入力文字列の個数,Lは各入力文字列の長さ,dは入力距離パラメータである.また,文字列のサイズが4であるとき(すなわち,DNAのとき),以前のアルゴリズムはnL+nd・13.922^d時間を要するのに対し,新しいアルゴリズムはnL+nd^3・13.183^d時間を要する.新しいアルゴリズムが非常に複雑であるため,その実装はまだできていない.以前の2-stringアプローチに基づくアルゴリズムがすでに実装されているので,新しいアルゴリズムを実装してからそれと以前のプログラムを同じコンピュータ上で動かせて,両者の実際の性能を比較したい.これは今後の課題の1つである.
|