2017 Fiscal Year Annual Research Report
Development of statistical methods for large scale somatic mutation data mining
Project/Area Number |
15K00398
|
Research Institution | The University of Tokyo |
Principal Investigator |
白石 友一 東京大学, 医科学研究所, 助教 (70516880)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | がんゲノム / パターンマイニング / 可視化 / 統計手法 |
Outline of Annual Research Achievements |
がんゲノムデータの解析コホートの解析結果のQuality Control、検体ごとの構造変異のプロファイル、変異データのサマリー、変異シグナチャーの解析結果などを可視化し、インタラクティブなHTMLレポート形式で生成するソフトウェア、paplot (https://github.com/Genomon-Project/paplot)の開発を行い、国際学術誌、Journal of Open Source Softwareに採録された。
サンプル調整の段階でDNAライブラリが酸化し、C>Aのアーティファクトの変異が生じてしまう現象が知られているが、そちらについてTCGAからダウンロードした約9,000検体のエキソームシークエンスデータの解析を通じて、変異のパターンマイニングを行い、変異パターンをがん種横断的に調査した。また、その結果から、C>Aのアーティファクトを除去する方法論の開発を行い、性能を評価した。
前年度より続けている、新規統計手法(SAVNet, https://github.com/friend1ws/SAVNet)を利用し、TCGAの約9,000検体のエキソーム、RNAシークエンスデータを用いて、スプライシング異常を引き起こすゲノム変異カタログを収集・二次解析するプロジェクトにおいて、変異のパターンマイニングの解析結果などをまとめ、プリプリントサーバーにアップロードし(https://www.biorxiv.org/content/early/2017/09/28/162560)、また国際学術誌に投稿した。さらに、SAVNetについては、ソフトウェアとしての体裁を整え、Webドキュメント(http://savnet.readthedocs.io/en/latest/)などの整備も行った。
|
Research Products
(8 results)