研究概要 |
この研究は,計算知能理論に基づいて,DNA配列やアミノ酸配列が作りだすソフトなパターンを発見するための汎用アルゴリズムを開発し,生命情報配列中の特定機能部位をin silicoで予測することを目的とした.このとき,設定問題が単に計算機科学的な仮想問題に留まらないように,ウェットバイオロジーの研究者を構成員として加えた.生命情報をin silicoで扱うITおよび情報科学者と,それを試験管内で扱う生命科学者の融合にはまだ時間を要するが,下記のような成果を得てこの方向を推進することができた. (1)ヒトやE.coliのDNA配列を対象とし,遺伝子の直前にある転写開始点の位置を推定する方式を確立した.特にヒトに対しては,スペクトラムカーネルとよばれる転写開始点付近の特徴抽出法と隠れマルコフモデルによるプロモータモデルに加えて,高速フーリエ変換に基づいたノンプロモータモデルを導入し,最後にサポートベクトルマシンで判定結果を出すということを行ない,トップクラスの予測性能を示すROC曲線を得ることができた. (2)アミノ酸配列の多重アラインメントに対して新たなアルゴリズムを得た.この方法はアラインメントを施す時に複数の配列間で生じるギャップの重なりを少なく押さえ,かつギャップ延長を区分線形にしたものとして,ClustalWやT-Coffeeよりも実データに近い結果を与えるものとなっている. (3)ウェットバイオロジーの部分においては,Rad51という二本鎖切断を修復する遺伝子の結合部位が乳ガン患者において改変されていることを発見した. 以上のように,この研究においては,ポストゲノムとしての主要テーマの一つであるプロモーターや転写開始点の予測,配列比較の中心課題である多重アラインメント,そして生命そのものに関連するRad51という分野において先端的な成果を得ることができた.
|