研究概要 |
[目的の概要] この研究は,計算知能理論に基づいて,ヌクレオチド配列やアミノ酸配列が作りだすソフトなパターンを発見するための汎用アルゴリズムを開発し,それを用いて生命情報配列中の特定機能部位をin silicoで予測することを主目的としている.このとき,設定している問題が単に計算機科学的な仮想問題に留まらないように,ウェットバイオロジーの研究者が重要な構成員として参加している. [成果] 平成19年度においては,次のような三項目において成果が得られた. (1)ヒトのDNA配列を対象とし,遺伝子の直前にある転写開始点の位置を推定する方式を確立した.この方式においては,スペクトラムカーネルとよばれる転写開始点付近の特徴抽出法と隠れマルコフモデルによるプロモータモデルに加えて,高速フーリエ変換に基づいたノンプロモータモデルを導入し,最後にサポートベクトルマシンで判定結果を出すということを行なっている.その結果,トップクラスの予測性能を示すROC曲線が得られた. (2)次に得られた成果は,アミノ酸配列の多重アラインメントに対して新たなアルゴリズムを得たことである.この方法はアラインメント時に複数の配列間で生じるギャップの重なりを少なく押さえ,かつギャップ延長を区分線形にしたものとして,ClustalWやT-Coffeeよりも実データに近い結果を与えるものとなっている. (3)ウェットバイオロジーの部分においては,Rad51という二本鎖切断を修復する遺伝子の結合部位が乳ガン患者において改変されていることを発見した. 以上のように,この研究においては,ポストゲノムとしての主要テーマの一つであるプロモータや転写開始点の予測,配列比較の中心課題である多重アラインメント,そして生命そのものに関連するRad51という三分野において先端的な成果を得ることができた.
|