The development of a high-performance nanopore methylation detection method with consideration of structural variation
Project/Area Number |
21K12104
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
張 耀中 東京大学, 医科学研究所, 特任准教授 (60817138)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | メチル化 / 事前表現学習モデル / k-mer / 全ゲノム表現学習 / methylation / nanopore sequencing / deep learning / ナノポアシーケンシング / 構造変異 / 深層学習 |
Outline of Research at the Start |
本研究では、ナノポアシーケンシングからがんゲノムやRNAウイルスの複雑なメチル化プロファイリングを正確に行うために、特定遺伝子型を考慮したディープニューラルネットワークによって高精度にメチル化を検出する情報解析技術を構築する。これまで独立して解析が行われていたゲノムアセンブリ、遺伝子変異同定、構造変異検出を統合し、アンサンブリングを行うことによって正確なメチル化プロファイリングを行うことのできる情報技術を提案する。
|
Outline of Annual Research Achievements |
今年度の研究は、二つに分けて進めた。1つ目は、snakemakeを使用し、特定遺伝子型を考慮しながらメチル化の同時検出が可能な自動化パイプラインを構築した。2つ目は、新しいメチル化検出手法を開発するため、塩基配列における事前表現学習モデルの研究を進めた。まず、異なる生物種の塩基データが事前表現学習モデルの影響に関して、昨年のプレプリントを改訂してBioinformatics誌に投稿し、採用された。そして、事前表現学習モデルが塩基配列で学習したものを明らかにするため、embedding層のk-mer表現を解釈し、文脈整合的k-mer表現を学習したことを検証した。伝統的なk-mer表現手法と比較し、国際会議Research in Computational Molecular Biology(RECOMB)でポスター発表を行なった。さらに、既存の事前表現学習モデルが塩基配列長さの制限に対して、全ゲノム表現学習のためにContrastive Learningを用いた新しい手法を開発した。この研究成果は現在査読中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
自動化パイプラインを構築した上で、塩基配列における事前表現学習モデルの効果的な部分を解明し、新しいメチル化検出手法を開発できるようになったため。
|
Strategy for Future Research Activity |
今後、事前表現学習モデルの成果をメチル化検出方法に応用し、構築した自動化パイプラインに統合を行う。さらに、最新のduplex sequencingデータにも開発したパイプラインで評価する予定である。
|
Report
(2 results)
Research Products
(11 results)