独自に開発したRNA構造アライメントのための遺伝的アルゴリズム(Cofolga2)と並列計算システムを用いて、酵母菌S.serevisiaeとその近縁種6種の間でペアワイズRNA構造アライメントによる配列比較を行い、新規非翻訳RNA候補の網羅的予測を行った。従来広く用いられている配列類似度によるアライメントに基づく予測手法では高い精度でRNA遺伝子予測を行うことが困難な、配列類似度の低い(50%以下)アライメントを予測の対象とした。独自にトレーニングしたサポートベクターマシーンに、配列比較により得られたRNA構造アライメントのアライメントスコアやアライメント長、塩基組成などを特徴ベクトルとして入力することにより非翻訳RNAの判定を行った。その結果、S.serevisiaeのゲノム配列から、比較ゲノムによる非翻訳RNA予測の従来手法(RNAz、QRNA)では予測されておらず、かつ既知非翻訳RNA配列と塩基位置の重なりや塩基配列の類似性を示さない新規非翻訳RNA候補を非タンパク質遺伝子コード領域から500個以上、タンパク質遺伝子コード領域から1000個以上予測することができた。現在、RNA構造アライメントのための新しい遺伝的アルゴリズム、ならびにS.serevisiaeとその近縁種の比較による新規非翻訳RNA候補予測の2つの結果をまとめた論文を執筆中であり、年内投稿予定である。
|