公共データベースにアーカイブされているRNA-seqなどの大規模な実験データは、世界中からの学術論文発表に伴って飛躍的に増大しているが、本研究で着目したlncRNAのように、それら大規模なデータの中に埋もれている生命現象がまだ多く残されている。本研究によって、lncRNAの1種である多様なリードスルー転写産物が、組織特異的な発現パターンを示すこと、様々な細胞ストレスによって発現が誘導されていること、難抽出性という特徴有すること等、徐々にその細胞内での役割の一端が明らかにされつつある。このようなアーカイブデータ再活用は、近年の深層学習等の発展に伴って、今後さらに重要になっていくものと考えられる。
|