• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Exploring repetitive sequence-derived RNAs in public databases

Research Project

Project/Area Number 23K28183
Project/Area Number (Other) 23H03493 (2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2023)
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

岩切 淳一  東京大学, 大学院新領域創成科学研究科, 助教 (40770160)

Project Period (FY) 2023-04-01 – 2028-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥18,200,000 (Direct Cost: ¥14,000,000、Indirect Cost: ¥4,200,000)
Fiscal Year 2027: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2026: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2025: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2024: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2023: ¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Keywords反復配列 / RNA-seq / 公共データベース / アーカイブデータ
Outline of Research at the Start

シークエンシング技術の飛躍的な発展により、完全なヒトゲノム配列が解読・公開され、ゲノムから転写されるRNAを網羅的に調べるRNA-seqの実験データも公共データベースに大量に蓄積されてきた。ヒトゲノム配列の中には、ある特定の配列が何度も繰り返し出現する反復配列が大量に存在しており、近年、これら反復配列から転写されるRNAの存在が明らかとなってきたが、これらRNAに着目した解析はほとんど行われていなかった。本研究では、完全なヒトゲノム配列の活用および公共データベースに大量に蓄積されているRNA-seqデータの再解析を通じて、ヒトの反復配列由来RNAの探索・情報基盤の構築を行う。

Outline of Annual Research Achievements

本研究では公共データベースに大量に蓄積されているヒトのRNA-seqデータを大規模に再解析することで、ヒトの反復配列由来RNAの探索を行う。本年度はデータベースに登録されている100万件以上のヒトのRNA-seqデータの中で、本研究で解析対象とすべきRNA-seqデータを絞り込むために、先行してランダムに選んだ1万件分のデータを取得し、反復配列の検出や1件当たりのデータ解析にかかる時間の計測を行った。その結果、一部のデータサイズが小さすぎるRNA-seqデータについては、反復配列がほぼ検出されなかったため、今後の解析対象としては、1データに含まれるリード数が1,000万本以下のものは除外することとした。また、1データに含まれるリード数が5億本を超えるRNA-seqデータについては、データ解析に時間がかかりすぎていたため、これらも今後の解析対象から除外することとした。これらの条件で対象データの絞り込みを行い、2023年8月時点で約43万件のRNA-seqデータを解析の対象として選定した。
また、任意の反復配列を入力とした反復配列由来RNAを検出できる解析パイプラインを構築し、テストケースとして5種類の反復配列を選び、上記43万件のRNA-seqデータに対して、反復配列由来RNAの検出を実施した。その結果、約1万件のRNA-seqデータにおいて、反復配列由来RNAが検出され、これらの実験が行われたヒトの細胞において反復配列由来RNAが発現している可能性が示唆された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

解析対象とするデータの選別基準を策定し、実際に43万件のRNA-seqデータについて、実際に反復配列由来RNAの検出を実行できたため、本研究は順調に進展している。

Strategy for Future Research Activity

T2Tコンソーシアムが決定した完全なヒトゲノム配列に含まれる反復配列のカタログからヒトで検出すべき反復配列を取得し、実際に公共データベースに登録されているRNA-seqデータに対して、反復配列由来RNAの検出を実施していく予定である。2024年度以降も公共データベースには世界中から新しいRNA-seqデータが順次登録されていくので、1年に1回程度の頻度で新しい解析対象のRNA-seqデータを選別し、本研究の解析対象として順次追加・解析を行っていく。

Report

(1 results)
  • 2023 Annual Research Report
  • Research Products

    (1 results)

All 2024

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results)

  • [Journal Article] Genomic screening of fish‐specific genes in gnathostomes and their functions in fin development2024

    • Author(s)
      Kudoh Hidehiro、Yonei‐Tamura Sayuri、Abe Gembu、Iwakiri Junichi、Uesaka Masahiro、Makino Takashi、Tamura Koji
    • Journal Title

      Development, Growth & Differentiation

      Volume: 66 Issue: 3 Pages: 235-247

    • DOI

      10.1111/dgd.12918

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access

URL: 

Published: 2023-04-18   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi