2020 Fiscal Year Research-status Report
アーカイブデータの大規模解析による長鎖非コードRNA機能解析のための情報基盤構築
Project/Area Number |
20K12041
|
Research Institution | The University of Tokyo |
Principal Investigator |
岩切 淳一 東京大学, 大学院新領域創成科学研究科, 助教 (40770160)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 長鎖非コードRNA / lncRNA / RNA-seq / 組織特異性 / poly-A化 / 細胞内局在 |
Outline of Annual Research Achievements |
今年度はENCODEプロジェクトが公開しているRNA-seqデータを中心としたデータ解析を実施し、各lncRNAごとにヒトの46組織の中で特異的に発現している組織を特定した。特に、既知(アノテーション情報の存在する)のlncRNAの発現解析だけに留まらず、タンパク質コード遺伝子の転写が正しい位置で終結せずに、転写が遺伝子下流まで非常に長く伸長されることで発現するRNA(リードスルー転写産物)の検出を行う解析パイプラインを開発し、組織特異的に発現するこのような転写産物を数多く検出することができた。検出数の多い組織では、おおよそ2000種類のタンパク質コード遺伝子の下流から、このようなRNAが転写されていることが明らかとなった。また、poly-AによるRNAの生成を実施しているRNA-seqデータと、poly-A付加されたRNAを除去したRNA-seqデータを用いて、リードスルー転写産物の検出数を比較したところ、poly-A付きRNAを除去したサンプルにおいて、より多くのリードスルー転写産物が検出された。このことから、これらのリードスルー転写産物の多くはpoly-A化を受けていないことが示唆された。さらに、細胞の中で核と細胞質由来のサンプルを用いたRNA-seqのデータを用いて、リードスルー転写産物の検出を行ったところ、核由来のサンプルにおいて、より多くのリードスルー転写産物が検出された。このことから、これらのRNAは核に局在し、翻訳されていないことが示唆された。 これらのことをまとめると、ヒトの組織のなかでは、lncRNAの1種であるリードスルー転写産物が組織特異的に多く発現しており、これらの転写産物は、普通のmRNAとは異なり、poly-A化を受けず、転写後に核内に留まっていることが示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していた国際コンソーシアムのRNA-seqデータの解析が順調に進み、さらに、既存のアノテーション情報にないリードスルー転写産物の検出まで実施することができたため。
|
Strategy for Future Research Activity |
今年度開発したRNA-seqデータの解析パイプラインを利用して、より多くのRNA-seqデータからlncRNAの発現量やリードスルー転写産物を含めた新規の転写産物の検出を進めると同時に、eCLIP(RNA-タンパク質相互作用)やRIC-seq(RNA-RNA相互作用)、icSHAPE(RNA2次構造)などの新しい実験データに対応した解析パイプラインを構築し、これらのデータからlncRNAの特徴・機能に関する情報を抽出する予定である。また、新型コロナウイルスに感染したヒト細胞のRNA-seqデータの解析の実施も新たに検討する。
|
Causes of Carryover |
新型コロナウイルス感染症により、当初予定していた国際学会への出張ができなくなったため次年度使用額が生じた。来年度以降も同様のことが生じると予想されるため、次年度使用額の範囲で、コロナウイルスに感染したヒト細胞のRNA-seqデータの解析実施を新たに検討する。
|
Research Products
(4 results)