2015 Fiscal Year Annual Research Report
RNA結合タンパク質結合サイト周辺のRNA構造モチーフ発見とデータベース開発
Publicly Offered Research
Project Area | Neo-taxonomy of noncoding RNAs |
Project/Area Number |
15H01465
|
Research Institution | The University of Tokyo |
Principal Investigator |
木立 尚孝 東京大学, 大学院新領域創成科学研究科, 准教授 (80415778)
|
Project Period (FY) |
2015-04-01 – 2017-03-31
|
Keywords | バイオインフォマティクス / RNA情報解析 / RNA二次構造 / RNA結合タンパク質 / CLIP-seq解析 / RNA結合モチーフ / 確率モデル |
Outline of Annual Research Achievements |
本研究の主目的は、RNA 結合タンパク質 (RBP) 結合サイト周辺に頻出する配列・構造モチーフを、 CLIP-seqデータから発見するための、RNAインフォマティクス技術の開発を行い、RBPのター ゲット分子認識機構の解明を目指すことであった。この課題については、二次構造のエネルギーモデルによる二次構造確率の計算と、RBP結合部位の配列特異性を表す重み行列(Position Specific Weight Matrix、PSSM)の推定とを条件付きランダム確率場(Conditional Random Fields, CRF)の枠組みで同時に行うアルゴリズム(RNAelem)の開発・及び実装に成功した。二次構造モチーフの生成ソフトウェアを用いたシミュレーション実験の結果、RNAelemは、従来のソフトウェアに比べて、高い精度で正しい二次構造モチーフを推定できることが分かった。また、RBP結合部位の配列特異性の強弱を変化させると、それに応じて、二次構造的な特異性への依存性もあるべき方向に変化することが分かり、アルゴリズムが妥当な動作をすることが判明した。今後は、背後にあるモチーフの二次構造パターンを様々に変化させた場合のRNAelemの精度変化を調べることにより、実用的なソフトウェアであることを検証することが必要である。 本年度はそのほかに、本学術領域の実験研究者との共同研究を行い、CLIP-seq, RNA-seq, PARIS等のRNAとRBPに関する実データ解析を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
配列・二次構造モチーフアルゴリズムについては、初年度に開発及び実装を終える予定にしていた。しかしながら、想定していたアルゴリズムを実装したところ、計算速度の面で十分な性能が出ず、十分な計算機実験も難しいことが分かった、このため、計算速度を改善するための新たな方策を考案・実装することが必要になった。
|
Strategy for Future Research Activity |
計算速度を改善するため、予め計算済みの塩基対確率行列の値を用いて、塩基対を組むことを考慮する領域を制限することを試しているところである。また、確率モデル自体に柔軟性を持たせることにより、モチーフ候補として検索する二次構造パターンを減らすことができると考えており、これを試そうとしているところである。
|