2018 Fiscal Year Annual Research Report

ベイズモデルによる大規模癌ゲノムシークエンスデータの高精度ヘテロ性解析

Research Project

Project/Area Number	17J08884
Research Institution	The University of Tokyo
Principal Investigator	森山卓也東京大学, 情報理工学系研究科, 特別研究員(DC1)
Project Period (FY)	2017-04-26 – 2020-03-31
Keywords	階層ベイズモデル / 系統樹 / がんゲノム / 体細胞変異検出 / 次世代シークエンサー
Outline of Annual Research Achievements	1. 複数の特徴を階層ベイズモデルの中で考慮に入れた体細胞変異検出手法の開発. 去年度は論文執筆を行い、国際誌 Bioinformatics に論文投稿を行った。今年度は査読者からの返信を受け追加実験や論文の更正を行い、投稿から11ヵ月かけ、 2019/02/28に論文の採択通知を受けた。 2. 複数のがん細胞のシークエンスデータを使う, 高精度な変異検出手法の開発. 去年度は、上記手法に関しての大まかなモデル化のアイデアを発着し、非常に簡単なシミュレーションにより、動作確認をしていた。今年度は、評価の部分とモデル化の部分に関して、より詳細な検討を行い、上記手法の研究開発を進めた。評価では、入力行列を直接シミュレーションする方法ではなく、実データをもとにシークエンスデータをシミュレーションにより生成させる方法により、評価した。また、シークエンスデータを開発中の手法の入力に変換するソフトウェアは存在しないため、3000行程度のソフトウェアを新たに自作。モデル化の部分に関しては、i) シークエンスデータに細胞の混合がある場合、 ii) 同じシークエンスデータが入力に含まれる場合の二つに関して、より詳細な検証を行った。 i) の場合に関して、がんの進化系統樹が単一である仮定のもとで、変異がどのデータに存在するかを表す変異パターンは、進化系統樹の葉の数の2倍程度しか存在しないという性質がわかった。そのため i) の場合においても、クラスタリングにより真の変異箇所とエラーを判別する本手法のモデル化が有効である予想を立てることができた。ii) の場合、去年度のモデル化ではバイクラスタリングをうまく行うことはできなかった。そこで、行方向のクラスタリングを階層的なクラスタリングに拡張し、同一のシークエンスデータを一つにまとめた上でバイクラスタリングを行うように、拡張した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason ・複数の特徴を階層ベイズモデルの中で考慮に入れた体細胞変異検出手法の開発去年度は論文執筆を行い、国際誌 Bioinformatics に論文投稿を行った。今年度は査読者からの返信を受け追加実験や論文の更正を行い、投稿から11ヵ月かけ、2019/02/28に論文の採択通知を受けた。・複数のがん細胞のシークエンスデータを使う, 高精度な変異検出手法の開発去年度は、上記手法に関しての大まかなモデル化のアイデアを発着し、非常に簡単なシミュレーションにより、動作確認をしていた。今年度は、評価の部分とモデル化の部分に関して、より詳細な検討を行い、上記手法の研究開発を推し進めた。
Strategy for Future Research Activity	本研究課題の一つの大きな目標は以下の3つの変数を用い、 T)->S)->D)の依存関係をもつ生成モデルを作成することである。T) 木構造の状態を表す潜在変数、 S)体細胞変異変異の状態を表す潜在変数、 D)実際のシークエンスデータを表す観測変数。前年度までに、S)->D)の生成モデルに関しては、修士課程までに作成していたモデルの拡張を行い、国際誌にて採択され、T)->S)の生成モデルに関しては、複数の生成モデルの検討を行い、実データを元にした精緻なシミュレーションをもとに評価を行うことができた。これらを踏まえて今年度では以下の研究を執り行う。 1 実データを元にした精緻なシミュレーションだけではなく、完全な実データのみによる評価実験の検討。前年度までの調査で、公開されている実データだけでは十分な評価ができない可能性があることがわかったため、実データの採取なども必要に応じて検討を行う。 2 構築した T)->S)->D) 依存関係を持つ生成モデルに対する評価実験や生成モデルの詳細などをまとめた学術論文を執筆する。 3 構築した T)->S)->D) 依存関係を持つ生成モデルを用いた推定が他の研究者からも利用可能にするために、作成したプログラムを公開し、ソフトウェアとしてまとめる。

Research Products
(5 results)

All 2019 2018

All Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (4 results) (of which Int'l Joint Research: 1 results)

[Journal Article] A Bayesian model integration for mutation calling through data partitioning2019
- Author(s)
  Takuya Moriyama, Seiya Imoto, Shuto Hayashi, Yuichi Shiraishi, Satoru Miyano and Rui Yamaguchi
- Journal Title
  
  Bioinformatics
  
  Volume: 印刷中 Pages: 印刷中
- DOI
  btz233
- Peer Reviewed / Open Access
[Presentation] Accurate detection of somatic mutations by leveraging tumor phylogenetic tree information2018
- Author(s)
  森山卓也
- Organizer
  IIBMP
[Presentation] 複数箇所のがん組織ゲノムデータを利用し高精度な体細胞変異検出を行う階層ベイズモデルの開発2018
- Author(s)
  森山卓也
- Organizer
  統計関連学会連合大会
[Presentation] バイクラスタリングに基づいたがん進化のモデリングと体細胞変異検出への応用2018
- Author(s)
  森山卓也
- Organizer
  IBISML
[Presentation] Leveraging phylogeny tree information for somatic mutation calling2018
- Author(s)
  森山卓也
- Organizer
  IBSB
- Int'l Joint Research

2018 Fiscal Year Annual Research Report

ベイズモデルによる大規模癌ゲノムシークエンスデータの高精度ヘテロ性解析

Principal Investigator

森山 卓也 東京大学, 情報理工学系研究科, 特別研究員(DC1)

Current Status of Research Progress

Reason

Research Products

[Journal Article] A Bayesian model integration for mutation calling through data partitioning2019

Author(s)

Journal Title

DOI

[Presentation] Accurate detection of somatic mutations by leveraging tumor phylogenetic tree information2018

Author(s)

Organizer

[Presentation] 複数箇所のがん組織ゲノムデータを利用し高精度な体細胞変異検出を行う階層ベイズモデルの開発2018

Author(s)

Organizer

[Presentation] バイクラスタリングに基づいたがん進化のモデリングと体細胞変異検出への応用2018

Author(s)

Organizer

[Presentation] Leveraging phylogeny tree information for somatic mutation calling2018

Author(s)

Organizer

森山卓也東京大学, 情報理工学系研究科, 特別研究員(DC1)