2021 Fiscal Year Research-status Report
The development of a high-performance nanopore methylation detection method with consideration of structural variation
Project/Area Number |
21K12104
|
Research Institution | The University of Tokyo |
Principal Investigator |
張 耀中 東京大学, 医科学研究所, 特任准教授 (60817138)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | methylation / nanopore sequencing / deep learning |
Outline of Annual Research Achievements |
本研究では、ナノポアシーケンシングから複雑なメチル化プロファイリングを正確に行うために、特定遺伝子型を考慮したディープニューラネットワークによって高精度にメチル化を検出する情報解析技術を構築する。これに関して今年度には、以下三つの研究を進めた。 (1)評価用データの収集と学習データを作成した。DNAメチル化の5mCと6mAを中心として、近年発表されたベンチマークデータを網羅的に収集し、分析した。学習データを作成するため、山口貴世志講師と共同研究し、細胞株RKOに対して、全ゲノムとメチル化なし(全ゲノム増幅した)のナノポアシーケンシングと解析を行った。増幅手法によって(Multiple displacement amplification(MDA)とランダムプライミング技術)、ナノポアシーケンシングデータの品質を分析した。 (2)評価用データにおけるBi-directional transformer encoderを利用し、ナノポアシーケンシングデータのためのメチル化を予測する方法を開発した。予測精度に大きく影響を与える電圧信号の特徴を分析し、目標塩基と離れている距離をモデルに考慮し、軽量化かつ精度も負けないモデルが開発した。この成果は、国際会議IEEE International Conference on Bioinformatics and Biomedicine (BIBM)へ投稿し、採択された。 (3)構造変異に関して、変異区間(特に分断点の位置)の予測精度を上げるため、ディープニューラネットワークの構造を改善した。リードデプスより、1塩基精度の予測が可能になった。この成果は、論文の一部としてPLoS computational biologyに発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
基本計画に沿ってデータ解析基盤と予測方法の開発が進みつつあり、予定していた特定遺伝子型を考慮したディープニューラネットワークによって高精度にメチル化を検出する情報解析技術が可能となったため。
|
Strategy for Future Research Activity |
今後、パイプラインを開発し、続いて、遺伝子型情報と開発したモデルと統合を行う。 一方、教師データの依存を減少させるため、ナノポアシーケンシングデータを応用できる自学習手法を開発する予定である。
|
Causes of Carryover |
世界的な半導体不足が続いて、購入予定の大規模データを処理するためにワーキングステーションが年度内に納品できなかった。次年度に購入予定である。
|