研究課題/領域番号 |
18H03327
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
白石 友一 国立研究開発法人国立がん研究センター, 研究所, ユニット長 (70516880)
|
研究分担者 |
片岡 圭亮 国立研究開発法人国立がん研究センター, 研究所, 分野長 (90631383)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | がんゲノム / スプライシング / トランスクリプトーム / ゲノム変異 / クラウド |
研究実績の概要 |
スプライシングの異常に繋がるゲノム変異(スプライシング関連変異)はがんの進展において重要な働きを示すことが知られている。研究代表者はこれまでゲノムデータとトランスクリプトームデータを統合的に用いて、スプライシング関連変異を網羅的に探索する方法論の統計的手法(SAVNet, Genome Research, 2018)の開発を進め、大規模なデータセットに応用することで、スプライシング関連変異のカタログの生成を行ってきた。これまでに引き続き、SAVNetを通じて国際がんゲノムコンソーシアムにおけるがん種横断的全ゲノム解析プロジェクトを始め、様々な解析プロジェクトへの貢献を続けている。また、既存手法では、ゲノムデータとトランスクリプトームのペアが必要であったが、多くのプロジェクトにおいてはゲノムデータとトランスクリプトームの片方しかないケースも多く、そのことで、既存のデータを最大限に利活用できないという問題点があった。そこで、トランスクリプトームデータのみからスプライシング関連変異を推定する方法論の開発を進めている。さらに、NCBI, EBI, DDBJなどの公共レポジトリに膨大な量のシークエンスデータの蓄積が進んでおり、これらの大規模データを用いることで、さらにスプライシング関連変異についての解析・カタログ化が加速度的に進むと考えられる。そのため、コンテナ仮想化技術、クラウド計算技術などの技術を統合的に組み合わせることで、大規模とランスクリプトームの情報解析基盤の開発を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の研究成果の一つとしては、国際がんゲノムコンソーシアムが主導するがん種横断的な全ゲノム解析プロジェクト(Pan-Cancer Analysis of Whole Genomes)における全ゲノムとトランスクリプトームの統合解析のワーキンググループにおいて、SAVNetを使ったこれまでの解析結果をまとめて、論文発表への貢献を行ったことである。ここでは、1,900個のスプライシング変異を同定し、その変異群と様々な機能(がん関連遺伝子への集積、Alu配列とのオーバーラップ)についての解析を行った。特に、deep intronにおける偽エキソンを生成する変異とAlu配列とは有意なオーバーラップが見られ、このことは種の進化で見られるAlu配列の変異によるエキソンの進化ががんの進化でも生じていることを強く示唆するということが一つのメインの発見結果である。また、SAVNetを改良し様々ながんゲノム解析プロジェクト、希少疾患のデータに適用することで、いくつかの新規遺伝子変異の発見にも繋がりつつある。 また、ゲノムデ・トランスクリプトームのペアが揃っている場合だけではなく、トランスクリプトームデータのみからスプライシング関連変異の探索を行う方法論の開発を進めている。例として、イントロン残存(イントロン残存の場合にはゲノム変異がトランスクリプトームリードに残る性質を利用)を引き起こすタイプのゲノム変異の探索を行う方法論(iravnet)の開発を進めており、こちらについては最適化が進んでいる。また、当該手法をクラウド上でSequence Read Archiveのトランスクリプトームデータに対して実行する解析パイプラインの開発を進めており、すでに数万検体の解析が終了しており、変異のカタログ化が進んでいる。
|
今後の研究の推進方策 |
Sequence Read Archive上には数十万検体の公共ヒトトランスクリプトームのデータがあり、まずは、現在開発を進めているクラウド上で、レポジトリからデータのダウンロード、アラインメント、iravnetの実行を行う解析パイプラインの精緻化を進め、数十万検体の解析によるスプライシング関連変異の実行を行う。次に、獲得されたスプライシング関連変異に対して、疾患に関連している変異の抽出を行うプログラムの開発を行い、遺伝性疾患の保因者スクリーニングなどに利用可能かどうかについての検討を行うなどの解析を通じて、成果をまとめることを試みる。 また、トランスクリプトームのみからスプライシング関連変異を検出できる別のクラスとして、スプライシングモチーフを新たに生成するタイプの変異について、網羅的な探索を行うプログラムの開発を進めている。こちらについても検出精度の精緻化を進め、可能であればSequence Read Archiveの大規模データ解析を通じた変異のカタログ化を進めたいと考えている。 引き続き、SAVNetをはじめとする種々のスプライシング関連変異の探索プログラムを用いて、ゲノム解析パイプラインで検出した変異からがん遺伝子、疾患関連遺伝子の探索を行う共同研究は推し進める。
|