2016 Fiscal Year Annual Research Report
RNA結合タンパク質結合サイト周辺のRNA構造モチーフ発見とデータベース開発
Publicly Offered Research
Project Area | Neo-taxonomy of noncoding RNAs |
Project/Area Number |
15H01465
|
Research Institution | The University of Tokyo |
Principal Investigator |
木立 尚孝 東京大学, 大学院新領域創成科学研究科, 准教授 (80415778)
|
Project Period (FY) |
2015-04-01 – 2017-03-31
|
Keywords | バイオインフォマティクス / RNA情報解析 / RNA二次構造 / RNA結合タンパク質 / CLIP-seq解析 / RNA結合モチーフ / 確率モデル |
Outline of Annual Research Achievements |
本研究の主目的は、RNA結合タンパク質(RBP)結合サイト周辺に頻出する配列・構造モチーフを、CLIP-Seqデータから発見するための、RNAインフォマティクス技術の開発を行い、RBPのターゲット認識機構の解明を目指すことであった。この目的のために、二次構造のエネルギーモデルによる二次構造確率の計算と、RBP結合部位の配列特異性を表す重み行列(Position Specific Weight Matrix、PSSM)の推定とを条件付きランダム確率場(Conditional Random Fields、CRF)の枠組みで同時に行うアルゴリズム(RNAelem)の開発と実装を行っている。今年はRNAelemの最初の実装に成功し、シミュレーションデータを使った精度評価を行った。すると最適化されたパラメータは局所最適解に陥っており、精度が既存プログラムのものより劣ることがわかった。このため実装を変更し、バックグラウンド配列を、ポジティブデータのランダムシャッフルで置き換え、最急降下法の繰り返し計算のたびに、バックグラウンド配列をシャッフルし直す確率最適化法を用いることにした。すると、局所最適解に陥ることが少なくなり、精度が大幅に向上した。現在は、CLIP-seqの実データにRNAelemを適用する実験を行っている。課題は沢山のモチーフ候補パターンから尤もらしい候補を選ぶ手法であり、これについて検討を行っているところである。この他、更なる精度向上のために、ポジティブデータをランダムにバッチに区切り、確率最大可法を適用する手法の開発を進めているところである。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(2 results)