2018 Fiscal Year Annual Research Report
Development of methods for comprehensive characterization of somatic variants causing transcription aberrations and their application to genomic medicine
Project/Area Number |
18H03327
|
Research Institution | National Cancer Center Japan |
Principal Investigator |
白石 友一 国立研究開発法人国立がん研究センター, 研究所, ユニット長 (70516880)
|
Co-Investigator(Kenkyū-buntansha) |
片岡 圭亮 国立研究開発法人国立がん研究センター, 研究所, 分野長 (90631383)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | がんゲノム / ゲノム変異 / スプライシング / 機械学習 |
Outline of Annual Research Achievements |
シークエンス技術の革新により、ゲノム変異の網羅的な可能になり、数多くの疾患関連遺伝子変異が発見された。一方で、機能の推測が未知の遺伝子変異も数多く、大量に蓄積されているゲノム変異データを十分に活用できているとは言い難い状況が続いている。機能の未知の遺伝子変異の中で重要なクラスを締めるのは、転写の異常、特にスプライシング異常を引き起こす変異である。しかし、どのような変異がスプライシング異常を引き起こすのかについてのメカニズムについては未だに理解が進んでいない。
申請者は、ゲノム・トランスクリプトームシークエンスデータを統合的に用いて、転写異常につながる後天的変異を網羅的に検出する方法論(SAVNet, https://github.com/friend1ws/SAVNet)を開発し、大規模ゲノムデータに適用を通じて、スプライシング異常のカタログ化を行い、全体像の解明に努め、ゲノム医療の発展に寄与することを目指してきた。
本研究課題を通じては、構造異常などの様々な形式のゲノム変異において、スプライシング異常を引き起こすものを解明できるように方法論の改良を行い、大規模データへの適用を行っている。また、特に理解が進んでいない、deep intron上でのスプライシング異常を引き起こす変異の検出・予測方法について、機械学習の手法を用いつつ開発を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
SAVNetをTCGAの9,000検体のゲノム・エキソームに適用して、スプライシング変異の全体像を解明した研究について、さらなる解析を行い、結果をまとめ、国際学術誌において受理・出版された(Shiraishi et al., Genome Research, 2018)。また、ICGC PCAWG (PanCancer Analysis of Whole Genomes)において、国際共同研究グループと協調して約1,200検体の全ゲノムにSAVNetに適用し、deep intronにおけるスプライシング変異のメカニズムの解明を行うなどの貢献をしており(https://www.biorxiv.org/content/10.1101/183889v2)、こちらは現在投稿中である。
2018年度は、SAVNetを改良して、遺伝子内の構造異常について、スプライシング異常を引き起こすものの同定を可能にした。さらに、この方法をICGC, TCGAの全ゲノムデータ、エキソームデータに適用して、構造異常とスプライシング異常の関係性の全体像の解明を試みた。
|
Strategy for Future Research Activity |
2019年度においては、これまでに大規模ゲノムデータに適用して得られた構造異常とスプライシング異常の関連性の結果について、さらにゲノム構造異常の検出手法のチューニングを行い、精緻化を行ったのちに、様々な観点から生物・医学的な意義付けを行い、ゲノム医療に示唆を与えることを目指す。
また、deep intronの変異で、転写異常を引き起こすものを検出する方法論についても、機械学習の手法を首尾よく組み合わせつつ、感度・正答率の両面から優れた方法論の開発に着手する。さらに、開発手法をTCGA、GTEx、NCBI SRAなどから収集される大規模トランスクリプトームのデータベースを利用した解析を行い、変異のカタログ化、生物・医学的な意義付けを行うことを目指す。
|
Research Products
(7 results)