研究実績の概要 |
がんゲノムデータの解析コホートの解析結果のQuality Control、検体ごとの構造変異のプロファイル、変異データのサマリー、変異シグナチャーの解析結果などを可視化し、インタラクティブなHTMLレポート形式で生成するソフトウェア、paplot (https://github.com/Genomon-Project/paplot)の開発を行い、国際学術誌、Journal of Open Source Softwareに採録された。
サンプル調整の段階でDNAライブラリが酸化し、C>Aのアーティファクトの変異が生じてしまう現象が知られているが、そちらについてTCGAからダウンロードした約9,000検体のエキソームシークエンスデータの解析を通じて、変異のパターンマイニングを行い、変異パターンをがん種横断的に調査した。また、その結果から、C>Aのアーティファクトを除去する方法論の開発を行い、性能を評価した。
前年度より続けている、新規統計手法(SAVNet, https://github.com/friend1ws/SAVNet)を利用し、TCGAの約9,000検体のエキソーム、RNAシークエンスデータを用いて、スプライシング異常を引き起こすゲノム変異カタログを収集・二次解析するプロジェクトにおいて、変異のパターンマイニングの解析結果などをまとめ、プリプリントサーバーにアップロードし(https://www.biorxiv.org/content/early/2017/09/28/162560)、また国際学術誌に投稿した。さらに、SAVNetについては、ソフトウェアとしての体裁を整え、Webドキュメント(http://savnet.readthedocs.io/en/latest/)などの整備も行った。
|