2007 Fiscal Year Annual Research Report
生物配列の高次構造記述向き形式文法とその構造予測への応用
Project/Area Number |
05J02830
|
Research Institution | Kyoto University |
Principal Investigator |
加藤 有己 Kyoto University, 化学研究所, 特別研究員(PD)
|
Keywords | RNA2次構造 / RNA間相互作用 / キッシングヘアピン / 多重文脈自由文法 / タンパク質2次構造 / ベータシート / 動的計画法 |
Research Abstract |
形式文法の構文解析技術を応用した、非コードRNAやタンパク質の2次構造予測が注目を集めている。それらは折り畳み構造を形成することにより、生体内で何らかの機能を発揮する。構造と機能の間には相関があると言われており、機能推定のためには構造を知ることが重要である。今年度の前半では、非コードRNAの一種であるアンチセンスRNAが標的mRNAと結合することにより、タンパク質への翻訳を抑制する現象であるRNA間相互作用のモデル化を、形式文法を用いて行った。特に、各RNAが構成するヘアピンループのループ同士が塩基対を形成する、キッシングヘアピン構造に焦点を当てた。この構造は文脈自由文法では表現できないことが知られている。そこで、文脈自由文法の自然な拡張であり、表現能力の高い多重文脈自由文法でモデル化し、その確率的拡張モデルに対して設計した構文解析アルゴリズムを実装することにより、結合2次構造予測を行った。平均予測精度は85%程度で、文法を用いない既存モデルと比較しても勝るとも劣らない結果を得ることができた。また、今年度の後半では、タンパク質の2次構造の中で予測が難しいと言われるベータシートのモデル化を考案した。ここでは、逆平行アップダウンベータシートを扱った。まず、既存研究の形式文法によるモデル化に対する知見から、アミノ酸残基間の水素結合による相互作用を陽に考慮した、効率のよい動的計画アルゴリズムを設計した。このアルゴリズムは複雑な構造に対しても容易に拡張できるという柔軟性がある。計算機実験を行った結果、平均予測精度は75%程度で、既存研究と同等以上の性能を挙げている。また、多重文脈自由文法を用いたベータシートのモデル化を行った。さらに、任意の平面的ベータシートを予測する問題はNP困難であることを示した。
|
Research Products
(8 results)