2016 Fiscal Year Research-status Report
大規模がんゲノム変異データマイニングのための統計的手法の開発
Project/Area Number |
15K00398
|
Research Institution | The University of Tokyo |
Principal Investigator |
白石 友一 東京大学, 医科学研究所, 助教 (70516880)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | がんゲノム / 変異シグナチャー / スプライシング |
Outline of Annual Research Achievements |
DNAシークエンスとRNAシークエンスデータを統合的に扱い、スプライシング異常を引き起こすゲノム変異を網羅的に抽出する新規統計手法、SAVNet(https://github.com/friend1ws/SAVNet) の開発を行った。さらに、開発した手法をTCGAの約9000検体のエキソーム、RNAシークエンスデータに適用し、スプライシング異常を引き起こすゲノム変異の全体像を明らかにした。また、スプライシング異常を引き起こす変異について、前年度までに開発したpmsignatureを利用した変異パターンのマイニングを行い、スプライシング異常を引き起こす変異に特徴的な変異パターンを明らかにした。これらの研究成果は、現在論文投稿準備中である。
これまでの変異パターンのマイニングは、1塩基置換の情報のみを利用することが一般的であった。一方で、喫煙歴のある肺がんにおいてはCC>AA, 皮膚がんにおいてはCC>TTの2塩基置換が頻繁に生じていることが知られており、1塩基置換以外の変異の情報を統合的に利用することで、より精度の高い変異パターンマイニングが可能になることが期待されていた。しかし、1塩基置換以外の複雑な形式の変異の同定のための方法論は、まだ成熟しておらず、これらを正確に同定する方法論の開発が急務であった。そこで、シークエンスデータから二塩基置換を網羅的に検出する方法論・ソフトウェア(https://github.com/friend1ws/GenomonComplexMutation)の開発を行った。さらに、開発した手法をTCGAのエキソームのデータに適用することで、2塩基置換についての変異パターンの全体像について理解を深めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「スプライシング異常を引き起こす変異」という重要な変異のクラスについて、前年度までに開発したpmsignatureを首尾よく活用することで、これまでにはわからなかった知見を得ることができた。さらに、2塩基置換などの複雑な変異を正確に同定する方法論を開発することができた。
|
Strategy for Future Research Activity |
次年度は、全ゲノムシークエンスデータなどの解析を通じ、また、臨床情報などを統合的に用いて、2塩基置換の変異パターンのより詳細な解析に従事する。さらにがんゲノムについて精通した生物学者と協調することで、得られた変異パターンの生物学的、臨床的な意義を見いだすことを試みる。さらに、挿入・欠失、2塩基置換、構造変異など様々な複雑な形式の変異を統計モデルに組み込んだ手法の開発を進めたい。
|
Causes of Carryover |
研究発表の場としてふさわしい海外学会にタイミングが合わずに行けなかったことなどによる。
|
Expenditure Plan for Carryover Budget |
Amazon AWSやGoogle Cloudなどのクラウド環境を利用した解析のプラットフォームの開発のために、クラウドの使用料の一部として使用することを検討する。
|