• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Establishment of Cell-type Deconvolution Method in Bulk Epigenome Data

Research Project

Project/Area Number 23K11312
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionChiba University

Principal Investigator

露崎 弘毅  千葉大学, 大学院医学研究院, 特任講師 (70769520)

Project Period (FY) 2023-04-01 – 2028-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2027: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywordsバイオインフォマティクス / エピゲノム / シングルセルオミックス / 次元圧縮 / 機械学習
Outline of Research at the Start

ある細胞集団からRNA-Seqとエピゲノムを個々に計測した場合、行も列も共有しないDiagonalなデータ構造となる。Diagonalなデータは一般的に利用できるアルゴリズムが少ない、解析が難しいデータとなる。Diagonalなデータ同士を統合するため、以下の3つの方針を考える。
・方針1: DiagonalなデータをHorizontalなデータに変換する
・方針2: シングルセルマルチオミックスのデータを利用する
・方針3: 細胞に紐づく別のモダリティのデータを利用する

Outline of Annual Research Achievements

本研究では、バルクレベルで計測したエピゲノムのデータと1細胞RNA-Seqのデータを組み合わせることで、1細胞エピゲノムデータを計測することなく、バルクエピゲノムデータに含まれる細胞型ごとのプロファイルと、サンプルごとの細胞型の比率を推定する新規Cell-type Deconvolution手法を提案する。
本年度は、転写因子の結合サイトや、ヒストンの化学修飾を検出するバルクChIP-Seqデータに対するCell-type Deconvolution手法の開発を行い、細胞型ごとのプロファイルや、サンプルごとの細胞型の比率を推定することで、擬似的に1細胞的なデータ解析を行うための方法論の確立を目指した。
データとしては、マウスESC/MEF/EMLのH3K4me3/H3K4me2データ(Assaf Rotem, Nature Biotechnology, 2015)と、ヒトB細胞/T細胞のH3K4me3/H3K27me3データ(Kevin Grosselin, Nature Genetics, 2019)の2データセットのデータ整形を試みた。前者の著者らはこちらの再三の問い合わせに返答しなかったため、結果として準備できたのは、後者のデータのみである。
当初はこのscChIP-Seqデータから人為的に生成したバルクChIP-Seqデータと、同様にヒトB細胞/T細胞の遺伝子発現を計測したscRNA-Seqデータとを統合解析するCell-type Deconvolution手法の開発を予定していた。しかしながら、後述するように幾つかの理由から、今後は提案手法のバルクHi-Cデータへの適用に方針転換を予定している。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

以下の理由で、研究テーマの方針転換を行う。

1. scChIP-Seq実験の難しさ: 転写因子の結合サイトや、ヒストンの化学修飾を検出するChIP-Seqは、事前にターゲットとなるタンパク質を免疫沈降(IP)したのちに、そのタンパク質に結合したDNAを断片化し、次世代シーケンサーで検出する。そのため、データの品質が、IPの抗体の品質に大きく依存する難しく、再現度の低い実験であり、これをさらにシングルセル化した手法は未だ2つしか報告されておらず、提案手法の予測結果が正常に動作しているのかを確かめるための正解データセットの用意に難航している。

2. scATAC-Seqの台頭: ChIP-Seqと比較して、経験的にクオリティの高いエピゲノムデータを検出できるのが、ゲノムのオープンクロマチンを検出するATAC-Seqであり、1細胞ATAC-Seqは、10X Genomics社がキット化したことで現在世界的に普及している。そのため、今後はChIP-Seqから得られていた知見は、ATAC-Seqデータを介して得られると予想され、そのための方法論が幾つも提案されている。また、本研究で議論している、1細胞エピゲノムデータの細胞型アノテーションの難しさに関しても、現在は1細胞からRNA-SeqとATAC-Seqを同時に検出するscMultiomeキット(10X Genomics社)が広く利用されているため、より細胞型アノテーションしやすいscRNA-Seqでの細胞型ラベルをscATAC-Seqに流用するのが現在の主流となっている。

Strategy for Future Research Activity

ATAC-Seqと比較して、ゲノム間の相互作用を検出するHi-Cのシングルセル化は、ChIP-Seqと同様まだ未発達である。また、ChIP-Seqと異なり、Hi-Cデータから得られるゲノム間の相互作用という情報は、Hi-Cでしか得られない貴重なものである。そのため、幾つかの論文がバルクHi-Cデータに対するCell-type Deconvolution手法が提案されているものの、高クオリティなscHi-Cデータが存在しない、データ構造がゲノム領域×ゲノム領域で特殊な形といった理由から、解析手法の開発がそれほど進んでいない。そのため、本研究では、Referenceは上記のアノテーション済みscATAC-Seqとし、Hi-Cに含まれる細胞型ごとのプロファイルや、サンプルごとの細胞型の比率を推定するための方法論を確立する。
scRNA-Seqデータを利用したscATAC-Seqデータの細胞型アノテーションに関しては、共通した細胞で検出された場合(Vertical)でも、別々の細胞で検出された場合(Diagonal)でも、ある程度方法論が確立されつつあるため、それらを用いる予定である。エピゲノムデータは全て、ゲノム配列を一定間のビンで区切った領域データとして扱う予定である。scATAC-SeqとHi-Cは、ゲノム領域という共通のものを見ているため、これらはHorizontalなデータセットとなり、行列・テンソル分解としては、共通の因子行列を設定した上で、各々分解することに相当する。この時に、Hi-C側は、ゲノム領域×ゲノム領域という対称行列であることから、因子行列×因子行列として、データを近似することを考えている。これにより、従来手法と比べて、激的に計算速度を向上することができ、それによりビン幅が狭い高解像度なデータにも提案手法を適用できることを期待している。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (9 results)

All 2023

All Journal Article (6 results) (of which Peer Reviewed: 6 results,  Open Access: 6 results) Presentation (2 results) (of which Invited: 1 results) Book (1 results)

  • [Journal Article] Sctensor detects many-to-many cell-cell interactions from single cell RNA-sequencing data2023

    • Author(s)
      Tsuyuzaki Koki、Ishii Manabu、Nikaido Itoshi
    • Journal Title

      BMC Bioinformatics

      Volume: 24 Issue: 1 Pages: 420-420

    • DOI

      10.1186/s12859-023-05490-y

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Non-negative tensor factorization workflow for time series biomedical data2023

    • Author(s)
      Tsuyuzaki Koki、Yoshida Naoki、Ishikawa Tetsuo、Goshima Yuki、Kawakami Eiryo
    • Journal Title

      STAR Protocols

      Volume: 4 Issue: 3 Pages: 102318-102318

    • DOI

      10.1016/j.xpro.2023.102318

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] dcTensor: An R package for discrete matrix/tensordecomposition2023

    • Author(s)
      Tsuyuzaki Koki
    • Journal Title

      Journal of Open Source Software

      Volume: 8 Issue: 88 Pages: 5664-5664

    • DOI

      10.21105/joss.05664

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] iTensor: An R package for independent componentanalysis-based matrix/tensor decomposition2023

    • Author(s)
      Tsuyuzaki Koki
    • Journal Title

      Journal of Open Source Software

      Volume: 8 Issue: 87 Pages: 5496-5496

    • DOI

      10.21105/joss.05496

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] WormTensor: a clustering method for time-series whole-brain activity data from C. elegans2023

    • Author(s)
      Tsuyuzaki, K., Yamamoto, K., Toyoshima, Y., Sato, H., Kanamori, M., Teramoto, T., Ishihara, T., Iino, Y., and Nikaido, I.
    • Journal Title

      BMC Bioinformatics

      Volume: 24 Issue: 1 Pages: 254-254

    • DOI

      10.1186/s12859-023-05230-2

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] nnTensor: An R package for non-negative matrix/tensordecomposition2023

    • Author(s)
      Tsuyuzaki Koki、Nikaido Itoshi
    • Journal Title

      Journal of Open Source Software

      Volume: 8 Issue: 84 Pages: 5015-5015

    • DOI

      10.21105/joss.05015

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] 君たちはどう生きるか?2023

    • Author(s)
      露崎弘毅
    • Organizer
      IIBMP2023 ナイトセッション
    • Related Report
      2023 Research-status Report
    • Invited
  • [Presentation] オープニング2023

    • Author(s)
      露崎弘毅
    • Organizer
      IIBMP2023 LLMワークショップ
    • Related Report
      2023 Research-status Report
  • [Book] マルチオミクス データ駆動時代の疾患研究2023

    • Author(s)
      大澤 毅
    • Total Pages
      222
    • Publisher
      羊土社
    • ISBN
      4758104131
    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi