2021 Fiscal Year Research-status Report
アーカイブデータの大規模解析による長鎖非コードRNA機能解析のための情報基盤構築
Project/Area Number |
20K12041
|
Research Institution | The University of Tokyo |
Principal Investigator |
岩切 淳一 東京大学, 大学院新領域創成科学研究科, 助教 (40770160)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 長鎖非コードRNA / lncRNA / RNA-seq / リードスルー転写産物 / CLIP-seq / RNA-タンパク質相互作用 |
Outline of Annual Research Achievements |
昨年から引き続き、今年度はGTEx、Human Protein Atlasなどの国際コンソーシアムが公開しているヒト組織由来のサンプルを用いたRNA-seqデータの解析を実施し、アノテーション情報が存在する既知のlncRNAの発現解析を行うとともに、昨年開発したリードスルー転写産物の検出を行う解析パイプラインを用いて、リードスルー転写産物が多く発現している組織の探索も行った。またSRA/DRA/ENAアーカイブデータベースに登録されているヒト由来サンプルのRNA-seqデータを自動取得し、上記2つの解析が行えるように解析パイプラインを設計し、予備調査として1000サンプル分のデータをランダムに抽出して解析を実施、今後より大規模な解析な解析を行うために必要な計算資源および計算時間の見積もりを行った。 今年度は上記のRNA-seqのデータ解析と並行して、eCLIP(RNA-タンパク質相互作用)やPARIS(RNA-RNA相互作用)、icSHAPE(RNA2次構造)のデータを解析するための解析パイプラインの開発を行い、最初に既知の生物学的な現象がデータから確認できるかどうかのチェックを行った。eCLIPに関しては、比較的データ数が多いこともあり、lncRNAについてのRNA-タンパク質相互作用がある程度含まれていることが判明したが、RNA-RNA相互作用のPARISについては、発現量の高いRNAの相互作用以外には、lncRNAに由来する相互作用情報はほとんど得られなかった。また、RNA2次構造の情報についてもicSHAPEの実験データからの抽出を試みたが、こちらも発現量の高いRNAの構造情報が中心であることが判明した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していたRNA-seqのデータ解析は引き続き順調に進んでおり、RNA-seq以外の3種類の実験データ解析の解析パイプライン開発も行ったため、順調に進展していると考えている。
|
Strategy for Future Research Activity |
来年度も引き続きRNA-seqのデータ解析を進め、アーカイブデータベースに登録されているRNA-seqデータをより多く解析できるように解析パイプラインの高速化も同時に行うことで、より様々な実験条件におけるlncRNAの発現情報の収集を行う。また、RNA-RNA相互作用データについては、今年度実施したPARIS以外のデータの解析も実施予定である。
|
Causes of Carryover |
昨年と同様に新型コロナウイルス感染症により、当初予定していた国際学会への出張ができなくなったため次年度使用額が生じた。来年度も同様のことが生じると予想されるため、次年度使用額の範囲内で、lncRNAの情報交換を行える国内での研究会の開催を検討する。
|
Research Products
(2 results)