研究課題/領域番号 |
21K12104
|
研究機関 | 東京大学 |
研究代表者 |
張 耀中 東京大学, 医科学研究所, 特任准教授 (60817138)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | メチル化 / 事前表現学習モデル / k-mer / 全ゲノム表現学習 |
研究実績の概要 |
今年度の研究は、二つに分けて進めた。1つ目は、snakemakeを使用し、特定遺伝子型を考慮しながらメチル化の同時検出が可能な自動化パイプラインを構築した。2つ目は、新しいメチル化検出手法を開発するため、塩基配列における事前表現学習モデルの研究を進めた。まず、異なる生物種の塩基データが事前表現学習モデルの影響に関して、昨年のプレプリントを改訂してBioinformatics誌に投稿し、採用された。そして、事前表現学習モデルが塩基配列で学習したものを明らかにするため、embedding層のk-mer表現を解釈し、文脈整合的k-mer表現を学習したことを検証した。伝統的なk-mer表現手法と比較し、国際会議Research in Computational Molecular Biology(RECOMB)でポスター発表を行なった。さらに、既存の事前表現学習モデルが塩基配列長さの制限に対して、全ゲノム表現学習のためにContrastive Learningを用いた新しい手法を開発した。この研究成果は現在査読中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
自動化パイプラインを構築した上で、塩基配列における事前表現学習モデルの効果的な部分を解明し、新しいメチル化検出手法を開発できるようになったため。
|
今後の研究の推進方策 |
今後、事前表現学習モデルの成果をメチル化検出方法に応用し、構築した自動化パイプラインに統合を行う。さらに、最新のduplex sequencingデータにも開発したパイプラインで評価する予定である。
|
次年度使用額が生じた理由 |
Oxford Nanopore最新flowcell kit(R10.4)を待っていることと保存期限(三ヶ月)が短いの理由より、 次年度検証するときに使用予定である。
|