2022 Fiscal Year Research-status Report
The development of a high-performance nanopore methylation detection method with consideration of structural variation
Project/Area Number |
21K12104
|
Research Institution | The University of Tokyo |
Principal Investigator |
張 耀中 東京大学, 医科学研究所, 特任准教授 (60817138)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | メチル化 / 事前表現学習モデル / k-mer / 全ゲノム表現学習 |
Outline of Annual Research Achievements |
今年度の研究は、二つに分けて進めた。1つ目は、snakemakeを使用し、特定遺伝子型を考慮しながらメチル化の同時検出が可能な自動化パイプラインを構築した。2つ目は、新しいメチル化検出手法を開発するため、塩基配列における事前表現学習モデルの研究を進めた。まず、異なる生物種の塩基データが事前表現学習モデルの影響に関して、昨年のプレプリントを改訂してBioinformatics誌に投稿し、採用された。そして、事前表現学習モデルが塩基配列で学習したものを明らかにするため、embedding層のk-mer表現を解釈し、文脈整合的k-mer表現を学習したことを検証した。伝統的なk-mer表現手法と比較し、国際会議Research in Computational Molecular Biology(RECOMB)でポスター発表を行なった。さらに、既存の事前表現学習モデルが塩基配列長さの制限に対して、全ゲノム表現学習のためにContrastive Learningを用いた新しい手法を開発した。この研究成果は現在査読中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
自動化パイプラインを構築した上で、塩基配列における事前表現学習モデルの効果的な部分を解明し、新しいメチル化検出手法を開発できるようになったため。
|
Strategy for Future Research Activity |
今後、事前表現学習モデルの成果をメチル化検出方法に応用し、構築した自動化パイプラインに統合を行う。さらに、最新のduplex sequencingデータにも開発したパイプラインで評価する予定である。
|
Causes of Carryover |
Oxford Nanopore最新flowcell kit(R10.4)を待っていることと保存期限(三ヶ月)が短いの理由より、 次年度検証するときに使用予定である。
|