研究課題/領域番号 |
21K12104
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
張 耀中 東京大学, 医科学研究所, 准教授 (60817138)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | methylation / nanopore / deep learning / nanopore methylation / k-mer model / representation learning / pre-training / メチル化 / 事前表現学習モデル / k-mer / 全ゲノム表現学習 / nanopore sequencing / ナノポアシーケンシング / 構造変異 / 深層学習 |
研究開始時の研究の概要 |
本研究では、ナノポアシーケンシングからがんゲノムやRNAウイルスの複雑なメチル化プロファイリングを正確に行うために、特定遺伝子型を考慮したディープニューラルネットワークによって高精度にメチル化を検出する情報解析技術を構築する。これまで独立して解析が行われていたゲノムアセンブリ、遺伝子変異同定、構造変異検出を統合し、アンサンブリングを行うことによって正確なメチル化プロファイリングを行うことのできる情報技術を提案する。
|
研究成果の概要 |
ナノポアシーケンスデータでの高性能メチル化検出手法をモデルレベルとパイプラインレベルの両方で開発した。モデルレベルでは、Transformerモデルのencoderアーキテクチャを使ってmethBERTを開発した。BERTモデルで塩基配列の表現学習を検証した。同じゲノムlociにアライメントされたリードを統合利用することで新しいメチル化コーラーを開発した。パイプラインレベルでは、ハプロタイプおよびゲノム変異を考慮したメチル化予測パイプラインを構築した。このパイプラインは、正常および腫瘍細胞株を用いて検証された。その上、対照学習を通じて生物学的関係を導入することで、新しい表現学習方法を開発した。
|
研究成果の学術的意義や社会的意義 |
ゲノムシーケンシングのコストが安くなるにつれて、その利用も広がってきた。ゲノムシーケンシングデータをより迅速かつ高精度に解析することは、ヘルスケアや疾患診断において重要である。本研究では、ナノポアシーケンシングから高精度なメチル化プロファイリング解析技術を開発した。この技術により、メチル化を高速かつ高精度な検出することが可能になり、老化や疾患におけるエピジェネティックな変化を理解するために役割を果たすことが期待される。
|