2006 Fiscal Year Annual Research Report
生物配列の高次構造記述向き形式文法とその構造予測への応用
Project/Area Number |
05J02830
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
加藤 有己 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC1)
|
Keywords | RNA2次構造 / シュードノット / 確率多重文脈自由文法 |
Research Abstract |
形式文法の構文解析技術を応用した、RNAの2次構造解析が注目を浴びている。特に、1次構造上で塩基対が互いに交差して現れるシュードノット構造の重要性が指摘され、それをモデル化するための形式文法がいくつか提案されている。機能が未知のRNAは数多くあり、構造が類似していれば機能も類似するという生物学の経験則から、RNA2次構造解析がその機能の解明につながるものと期待されている。本研究の目的は、文脈自由文法の自然な拡張モデルで高い解析能力を持つ多重文脈自由文法(MCFG)を用いて、RNAの2次構造解析を行うことである。前年度は、MCFGの部分クラスの規則に確率を付与した確率多重文脈自由文法(SMCFG)を導入し、入力配列長の5乗のォーダーで確率最大の導出木を計算する構文解析アルゴリズム(CYKアルゴリズム)及びEMアルゴリズムに基づく確率パラメータ推定アルゴリズムを設計した。また、CYKアルゴリズムを実装し、シュードノットを含むいくつかのウイルス性RNAに対して2次構造予測を行った。今年度ではまず、提案手法の評価を行った。本質的にはCYKアルゴリズムに同等なアルゴリズムが設計されているペア確率接木文法(PSTAG)を比較対象として、同じRNAファミリーに対する2次構造予測精度を評価したところ、SMCFGに基づく手法が少なくとも同等以上でかつ99%以上の精度を示した。次に、CYKアルゴリズムを拡張した走査アルゴリズムによって、ゲノム配列上でシュードノット構造を持つRNAに転写される遺伝子の領域予測を行い、正しく遺伝子領域予測が行えることを確認した。先行研究の多くがシュードノットを考慮しない遺伝子発見を行っているため、本研究はシュードノットを扱うことが可能であるという点で特徴があると言える。以上のことから、遺伝子発見を含めたRNA2次構造解析に対して提案手法は有効であると考えられる。
|
Research Products
(4 results)