研究課題
基盤研究(C)
近年の技術革新により個人の全ゲノム配列を安価に解読することが可能となったが、表現型の予測はいまだ困難である。申請者はこの原因が現在主流の解析過程に何らかの見落としがあるためと考えた。これを克服するため、本研究では既存の解析のように遺伝子型の同定を経てから表現型を予測するのではなく、深層学習技術を用いて全ゲノム解読データから直接表現型を予測する方法論を構築する。また構築した方法をゲノムコホートデータに適用し、生活習慣病等の発症リスクの予測を可能にすることを目指す。
本研究は大規模ゲノムコホートや疾患ゲノム解析の主要な解析技術の一つであるNGSについて、その技術的限界を見極め、深層学習をはじめとした最新の技術でその限界を克服することを企図したものである。本研究のもと、NGSを用いたゲノム解析手法であるリシークエンシング法に潜むバイアスのうち民族集団の差によるバイアスに着目し、ヒトゲノム計画で構築された国際基準ゲノムに代わるものとして構築された日本人集団固有の基準ゲノム配列の性能評価を行った。結果は他の結果とともに論文化され、Nature Communications誌に発表された。また複数の招待講演を行なった。
次世代シークエンシング法を用いるとヒトの全ゲノム情報を数日の内に解読可能であるが、完璧な方法ではない。本研究では次世代シークエンシング法の問題点を追求し、特に、民族集団の違いによるバイアスを克服することを試みた。より具体的には日本人のゲノム解析に最適化した日本人基準ゲノム配列JG1の性能評価を行った。日本人基準ゲノム配列は公開され、ゲノム解析サービスに利用されており、本研究はその有用性を示すものとして大きな意義を有すると考えられる。
すべて 2022 2021 2020 2019 その他
すべて 雑誌論文 (2件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (6件) (うち国際学会 2件、 招待講演 4件) 備考 (1件)
月刊「細胞」
巻: 53(8) ページ: 44-46
Nature Communications
巻: 12 号: 1 ページ: 226-226
10.1038/s41467-020-20146-8
https://www.tohoku.ac.jp/japanese/2019/02/press-20190225-02-JRGA-web.html