• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Development of multi omics data analysis method using short/long read integration and complete human reference sequences

Research Project

Project/Area Number 23K11300
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

片山 琴絵  東京大学, 医科学研究所, 准教授 (40581195)

Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2023: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Keywordsバイオインフォマティクス / 長鎖リード / 短鎖リード
Outline of Research at the Start

これまでの腫瘍ゲノム解析では、短鎖リードを中心としリファレンスファイルをGRCh37またはGRCh38を用いて知見を積み上げてきた。しかし長大な繰り返し配列を含む領域に関しては、リード長が短い場合に解析が困難であった。
本研究は、がんゲノム分野においての短鎖リードと長鎖リードを統合解析するデータ解析技術を開発することで、これまで未解読であった領域の変異同定、長鎖リードの優位性を活かしたハプロタイプ分離によってがん生物学の理解を深化させることを目的とする。

Outline of Annual Research Achievements

これまでの腫瘍ゲノム解析では、多くのがん患者からのゲノム情報を解析することで、さまざまながん種でのドライバー変異など腫瘍を理解するための知見が蓄 積されてきた。一方、セグメント重複、セントロメア、テロメアといった長大な繰り返し配列を含む領域に関しては、2022年にヒトゲノムの完全配列の発表を起 として生殖細胞系列を中心とした解析が始まったばかりである。本研究では同一がん検体からの長鎖リードと短鎖リードデータを詳細に比較し、T2T-CHM13配列 をリファレンスとすることで短鎖リードでは同定不可能な変異、長鎖リードの深度に応じて特定可能な腫瘍内不均一性の検出限界などデータの統合解析をデザインするために必須の基礎データを得ている。がんゲノムにおける長鎖シークエンスの一般的な読み取り深度は腫瘍部位で30X程度、正常部位で10X程度に留まり、 また十分に腫瘍内不均一性など腫瘍における重要な特性を解析するにはいまだに多くの課題が残されているが、現状への足がかりとなるものである。短鎖リード を用いた解析においてリファレンスをGRCh38からT2T-CHM13配列に置き換えるだけでは短鎖リードのリード長(300bp程度)よりも長い繰り返し配列には、複数箇所にマッピングされることにより解析不能となり、これはT2T-CHM13配列をリファレンスとした場合にも起きる。この問題の解決のため、長鎖リードを用いこれらのマッピング困難な配列箇所をT2T-CHM13配列とGRCh38配列の差分から定め「非常に長い繰り返し配列」を内包するリード長をを用いることにより、短鎖リードで未決であった領域を長鎖リードにより補完してコンセンサス配列を確定させる手法を確立し、点変異および構造変異の同定が可能であるかの検討を行なった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

長鎖リードを用いこれらのマッピング困難な配列箇所をT2T-CHM13配列とGRCh38配列の差分から定め「非常に長い繰り返し配列」を内包するリード長をを用いることにより、短鎖リードで未決であった領域を長鎖リードにより補完するための評価と基本的手法の開発を行なった。この開発は公共データベースに長鎖・短鎖リードの両方の登録があるデータにより行なった。米国がんゲノムアトラス(TCGA)や国際がんゲノムコンソーシアム (ICGC) のデータとGIBに登録のあるデータを用いた。腫瘍学分野において、変異検出やコピー数変化は腫瘍部位と正常部位の両データが必須であるが、特に長鎖リードについては伝統的に構造変異に着目し、腫瘍部のみをシークエンスすることがほとんどであり、正常部位のデータを取得することが少なく、これは公共データベースへの登録についても同様であ
る。これらを基礎データとして評価とモデル構築を行い、また独自に保持する細胞株のデータでモデルの妥当性評価を行なった。前年度は実データでの腫瘍・正常両部位揃ってシークエンスした長鎖リードのデータが、出検の遅れからデータを入手が予定通り進捗しなかったが、今年度は予定通りデータを揃えることができ、基礎データ評価と現在構築しているモデル評価について実行できた。ハプロタイプの評価については現在の主流である長鎖リードの典型例である正常部位10Xはリード数が足りずに評価不能となる例もあったが、長鎖リードの深度の多いサンプルを用いてダウンサンプリングを行うことにより、性能限界の評価を行なっている最中である。また、同一サンプルを2つの異なるプラットホームから長鎖リードを入手することができた。そのうち1つはウルトラロングリードと呼ばれる特に長い長鎖リードである。ウルトラロングリードによる補完は機能的ではあるが、計算不可が高いことがわかりその修正を行なっている。

Strategy for Future Research Activity

現状では長鎖リードでの変異同定は生殖細胞系列を前提とした既存の変異同定ツールであるDeepVariantなどを流用するに留まり、正常と腫瘍のペアデータを前提とし、長鎖リードの優位性を活用した解析方法は存在しない。30Xの読み取り深度と腫瘍内不均一性を制約条件とした場合に、短鎖リードで検出された変異検出感度との比較、およびハプロタイプフェージングによるリード情報の活用可能性、および短鎖リードでこれまで検出できなかった長大な繰り返し配列での変異同定とその評価を行う。本年においてはこれまで検体収集状況に遅れがあった実データについても、データが到着しつつあるため、これまで用いてきた公共データベースからのデータと併せて、モデル構築と評価ができた。長鎖リードシークエンスデータと短鎖リードシーケンシングデータを用いて、ヒトゲノム完全配列(T2T-CHM13)を参照配列としてにマッピングを行うが、2つの異なるプラットホームからなる長鎖リードシークエンスデータを計算量不可を抑えつつ部分的にassembleすることによって、コンセンサス配列の精度を高める。また構造変異を同定し、短鎖リードシーケンシングデータから1塩基変異多型およびコピー数変化を同定する。この際、短鎖リードのリード長を超えた長大な繰り返し配列における変異情報は長鎖リードから得られたハプロタイプ分離の上での遺伝子変異とコピー数変化を事前分布と置き、リード長を超えた繰り返し部分に対する変異情報を推定し補完を行う予定である。また、長鎖リードから得られたハプロタイプの情報を手がかりとして、短鎖リードの評価困難領域についてde novo assemblyが可能であるかどうかの評価を行う。長鎖リードの特に正常部位では深度が十分といえない状況で、これを短鎖リードで補完可能であるかの検討し評価を行う予定である。

Report

(2 results)
  • 2024 Research-status Report
  • 2023 Research-status Report
  • Research Products

    (6 results)

All 2024 2023

All Journal Article (6 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 6 results,  Open Access: 4 results)

  • [Journal Article] GADD45β‐MTK1 signaling axis mediates oncogenic stress‐induced activation of the p38 and JNK pathways2024

    • Author(s)
      Kawataki Saeko、Kubota Yuji、Katayama Kotoe、Imoto Seiya、Takekawa Mutsuhiro
    • Journal Title

      Cancer Science

      Volume: 116 Issue: 1 Pages: 128-142

    • DOI

      10.1111/cas.16389

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Comparative analysis of the B cell receptor repertoire during relapse and remission in patients with multiple sclerosis2024

    • Author(s)
      Perez-Saldivar M, Nakamura Y, Kiyotani K, Imoto S, Katayama K, Yamaguchi R, Miyano S, Martinez-Barnetche J, Godoy-Lozano EE, Ordonez G, Sotelo J, Gonzalez-Conchillos H, Martinez-Palomo A, Flores-Rivera J, Santos-Argumedo L, Sanchez-Salguero ES, Espinosa-Cantellano M.
    • Journal Title

      Clinical Immunology

      Volume: 269 Pages: 110398-110398

    • DOI

      10.1016/j.clim.2024.110398

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] A novel mouse model of upper tract urothelial carcinoma highlights the impact of dietary intervention on gut microbiota and carcinogenesis prevention despite carcinogen exposure2024

    • Author(s)
      Yamamoto Akinaru , et.al
    • Journal Title

      International Journal of Cancer

      Volume: 156 Issue: 7 Pages: 1439-1456

    • DOI

      10.1002/ijc.35295

    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Single-cell analyses and host genetics highlight the role of innate immune cells in COVID-19 severity2023

    • Author(s)
      Japan COVID-19 Task Force
    • Journal Title

      Nature Genetics

      Volume: 55 Issue: 5 Pages: 753-767

    • DOI

      10.1038/s41588-023-01375-1

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Histological markers, sickle-shaped blood vessels, myxoid area, and infiltrating growth pattern help stratify the prognosis of patients with myxofibrosarcoma/undifferentiated sarcoma2023

    • Author(s)
      Washimi Kota、Kasajima Rika、Shimizu Eigo、Sato Shinya、Okubo Yoichiro、Yoshioka Emi、Narimatsu Hiroto、Hiruma Toru、Katayama Kotoe、Yamaguchi Rui、Yamaguchi Kiyoshi、Furukawa Yoichi、Miyano Satoru、Imoto Seiya、Yokose Tomoyuki、Miyagi Yohei
    • Journal Title

      Scientific Reports

      Volume: 13 Issue: 1

    • DOI

      10.1038/s41598-023-34026-w

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] KMT2C expression and DNA homologous recombination repair factors in lung cancers with a high-grade fetal adenocarcinoma component2023

    • Author(s)
      Suzuki Masaki、Kasajima Rika、Yokose Tomoyuki、Shimizu Eigo、Hatakeyama Seira、Yamaguchi Kiyoshi、Yokoyama Kazuaki、Katayama Kotoe、Yamaguchi Rui、Furukawa Yoichi、Miyano Satoru、Imoto Seiya、Shinozaki-Ushiku Aya、Ushiku Tetsuo、Miyagi Yohei
    • Journal Title

      Translational Lung Cancer Research

      Volume: 12 Issue: 8 Pages: 1738-1751

    • DOI

      10.21037/tlcr-23-137

    • Related Report
      2023 Research-status Report
    • Peer Reviewed

URL: 

Published: 2023-04-13   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi