• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

The development of a high-performance nanopore methylation detection method with consideration of structural variation

Research Project

Project/Area Number 21K12104
Research InstitutionThe University of Tokyo

Principal Investigator

張 耀中  東京大学, 医科学研究所, 准教授 (60817138)

Project Period (FY) 2021-04-01 – 2024-03-31
Keywordsnanopore methylation / k-mer model / representation learning / pre-training
Outline of Annual Research Achievements

本年度、最新のR10.4シーケンスデータに特化し、ハプロタイプおよびゲノム変異を考慮するメチル化予測パイプラインを構築した。このパイプラインは、細胞株(HG002、COLO829BL)および腫瘍細胞株(RKO、COLO829)での解析において検証された。特に、HG002のタンデムリピート領域におけるリードの特徴とメチル化予測の結果について詳細な検証を行った。この解析パイプラインは、シーケンシングプラットフォーム(MinION)と組み合わせて、より容易な現地展開のために、10Lサイズの小型自作PC上で実装した。
モデル開発において、塩基配列上でのBERTモデルを用いたプレトレーニングを通じて学習された重なるk-mer表現を網羅的に分析した。これらの学習された重なるk-mer表現を用いて、ナノポアシーケンスにおけるメチル化予測の可能性を示した。関連の研究成果はBioinformatics誌に発表された。さらに、k-merの信号モデルに焦点を当て、k-merの塩基配列と関連する信号との相関性を分析した。以前に開発したmethBERTモデルフレームワークを利用し、k-merの塩基と信号の表現をメチル化予測に利用した。この手法と新たなR10.4の学習データを用いて、methBERT2というメチル化予測のツールを開発した。
さらに、ディープラーニングモデルを使用した画像処理技術をゲノム解析およびナノポアシーケンシングへの応用について探索した。多様なゲノム情報を二次元の画像または画像のようなテンソルに変換し、ディープラーニング技術を用いてゲノム解析に応用した。全ゲノム配列の表現を学習するために、FCGR(Frequency Chaos Game Representation)画像形式を使用し、対照学習を通じて生物学的関係を導入することで、新しい表現の学習方法を開発した。この新しい手法については、Briefing in bioinformatics誌に発表された。シングルセルの応用に関する研究成果は、Scientific Reports誌に発表された。

  • Research Products

    (9 results)

All 2024 2023 Other

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 4 results) Presentation (2 results) (of which Int'l Joint Research: 2 results) Remarks (2 results)

  • [Journal Article] Predicting cell types with supervised contrastive learning on cells and their types2024

    • Author(s)
      Heryanto Yusri Dwi、Zhang Yao-zhong、Imoto Seiya
    • Journal Title

      Scientific Reports

      Volume: 14 Pages: 1-16

    • DOI

      10.1038/s41598-023-50185-2

    • Peer Reviewed / Open Access
  • [Journal Article] Zero-shot-capable identification of phage?host relationships with whole-genome sequence representation by contrastive learning2023

    • Author(s)
      Zhang Yao-zhong、Liu Yunjie、Bai Zeheng、Fujimoto Kosuke、Uematsu Satoshi、Imoto Seiya
    • Journal Title

      Briefings in Bioinformatics

      Volume: 24 Pages: 1-10

    • DOI

      10.1093/bib/bbad239

    • Peer Reviewed / Open Access
  • [Journal Article] Investigation of the BERT model on nucleotide sequences with non-standard pre-training and evaluation of different k-mer embeddings2023

    • Author(s)
      Zhang Yao-zhong、Bai Zeheng、Imoto Seiya
    • Journal Title

      Bioinformatics

      Volume: 39 Pages: 1-10

    • DOI

      10.1093/bioinformatics/btad617

    • Peer Reviewed / Open Access
  • [Journal Article] Microbial Gene Ontology informed deep neural network for microbe functionality discovery in human diseases2023

    • Author(s)
      Liu Yunjie、Zhang Yao-zhong、Imoto Seiya
    • Journal Title

      PLOS ONE

      Volume: 18 Pages: 1-13

    • DOI

      10.1371/journal.pone.0290307

    • Peer Reviewed / Open Access
  • [Journal Article] Imputing time-series microbiome abundance profiles with diffusion model2023

    • Author(s)
      Seki Misato、Zhang Yao-Zhong、Imoto Seiya
    • Journal Title

      IEEE Xplore

      Volume: BIBM 2023 Pages: 914-919

    • DOI

      10.1109/BIBM58861.2023.10385703

    • Peer Reviewed
  • [Presentation] Zero-shot-capable identification of phage-host relationships with whole-genome sequence representation by contrastive learning2023

    • Author(s)
      Yao-zhong Zhang
    • Organizer
      International Workshop on Bioinformatics and Systems Biology (IBSB)
    • Int'l Joint Research
  • [Presentation] Imputing time-series microbiome abundance profiles with diffusion model2023

    • Author(s)
      Misato Seki, Yao-zhong Zhang, Seiya Imoto
    • Organizer
      International Conference on Bioinformatics and Biomedicine (BIBM)
    • Int'l Joint Research
  • [Remarks] CL4PHI

    • URL

      https://github.com/yaozhong/CL4PHI

  • [Remarks] SCLSC

    • URL

      https://github.com/yaozhong/SCLSC

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi