研究概要 |
次に述べるように,3つの計算困難な問題について研究を行い,研究成果をあげることができた 1.蛋白質NMRピーク割り当て問題:この問題は,長いスピン系のセグメントの割り当てが簡単で,短いスピン系のセグメントの割り当てが難しい,という特徴を持つ.よって,本研究で短いスピン系のセグメントの割り当て,とりわけ高々2つのスピン系からなるセグメントの割り当てについて研究を行い,このスペシャルケースを解く近似率1.86の近似アルゴリズムを設計できた.さらに,この近似アルゴリズムと,本研究で以前提案した「貪欲濾過法」とを組み合わせることによって,蛋白質NMRピーク割り当て問題を解く新しいアルゴリズムを設計した.この新しいアルゴリズムを実際の蛋白質NMRピークデータの割り当てに適用した結果,以前のアルゴリズムよりよい実験結果を得た. 2.文字列の編集距離問題:これは,2つの文字列が与えられたとき,その2文字列がどれくらい似ているかを判定する問題である.この問題は計算的分子生物学において極めて重要で基本的な問題である.従来の研究では,2文字列の編集距離を求めるのに,既存文字の削除と既存文字の変更と空白文字の挿入という3つの操作しか許さなかった.しかし,生物の進化過程においてDNA列の変異としてDNA列の一部が反転してしまう操作が起こりうる.よって,2文字列の編集距離を求めるとき,文字列の部分列の反転という操作も含める必要がある.この操作を含めると,この問題がだいぶ難しくなり,以前のアルゴリズムは領域量O(n^4)のため,(非常に長い)実際のDNA列や蛋白質列の実験に使えなかった.本研究で,領域量がO(n^2)のアルゴリズムを設計することに成功した.このアルゴリズムを鼠などのDNA列や蛋白質列に適用した結果,鼠などの進化に関して今までなかった発見が見られた. 3.1平面グラフの彩色問題:1平面グラフとは各辺が高々1回交差されるように平面に埋め込めるグラフのことである.1平面グラフは平面グラフの自然な拡張であり,その彩色問題は古くから研究されてきた.本研究で,1平面グラフの4彩色問題がNP困難であることを証明した.また,1平面グラフを7彩色する線形時間アルゴリズムを設計できた.
|