研究課題/領域番号 |
16K16143
|
研究機関 | 東京大学 |
研究代表者 |
岩切 淳一 東京大学, 大学院新領域創成科学研究科, 特任研究員 (40770160)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | long non-coding RNA / RNA-RNA相互作用 / RNA-タンパク質相互作用 / CLIP-seq / 機械学習 |
研究実績の概要 |
lncRNA-RNA相互作用について、京コンピュータを利用した大規模な予測パイプラインを用いて、ヒトの全てのlncRNA、mRNAの配列の組み合わせについて、網羅的な相互作用予測を実施した。予測結果について、既に知られているヒトの相互作用データを用いて予測精度の検証を行ったところ、ある一定の予測精度が得ることができたが、一方で配列データだけから相互作用を高精度に予測することには限界があると考えられた。そのため、ヒトの様々な組織に由来するRNA-seq等の実験データと、配列データからの予測結果を組み合わせることで、より信頼性の高い予測を実現し、その成果を現在論文を投稿している。
lncRNA-タンパク質相互作用については、機械学習を用いた予測モデル構築のための学習データとして、公共データベースに公開されているCLIP-seqデータの解析パイプラインの開発を行い、実際のCLIP-seqデータの解析を進めている。現在までに、PAR-CLIPについては、RNA-タンパク質相互作用の抽出までの全ての解析を完了しており、HITS-CLIPやiCLIPに関しては、解析を実施中である。また2016年にENCODEプロジェクトが公開したeCLIPのデータについても解析パイプラインの構築を現在進めている。
また、lncRNAの分子間相互作用と機能についての総説を執筆した(生物物理 56(4), 217-220, 2016)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
lncRNA-RNA相互作用の予測手法の開発を優先したため、平成28年度ではlncRNA-RNA相互作用予測だけではなく、29年度に実施予定であった発現データを組み合わせた予測の高度化を先行して行った。
その代わりに、lncRNA-タンパク質相互作用予測に関しては、予測モデルの構築までは行えず、モデル構築に必要な学習データをCLIP-seqデータから取得するための解析パイプライン構築し、現在、実データの解析を進めている。
|
今後の研究の推進方策 |
今後は、CLIP-seqデータからのRNA-タンパク質相互作用のデータ抽出を行い、RNA-タンパク質予測モデルの構築を優先して行う予定である。特に2016年に公開された国際コンソーシアムENCODEによるeCLIPのデータでは、100種類を超える様々なRNA結合タンパク質に関するデータが公開されており、これらのデータを予測に取り入れることで、より幅広いlncRNA-タンパク質相互作用予測が可能になると考えられる。 また、CLIP-seqの解析結果については、必要に応じて実験研究者への提供も行い、RNA-タンパク質相互作用に関する共同研究を進めていく予定である。
|
次年度使用額が生じた理由 |
現在、lncRNA-RNA相互作用に関する論文を投稿しており、その論文掲載の費用として約20万円を残しておいたが、今年度内に掲載が決まらなかったので、次年度使用額が生じた。
|
次年度使用額の使用計画 |
この投稿中の論文が掲載されることで、次年度使用額の全てを使用する予定である。
|