2018 Fiscal Year Annual Research Report
ベイズモデルによる大規模癌ゲノムシークエンスデータの高精度ヘテロ性解析
Project/Area Number |
17J08884
|
Research Institution | The University of Tokyo |
Principal Investigator |
森山 卓也 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2017-04-26 – 2020-03-31
|
Keywords | 階層ベイズモデル / 系統樹 / がんゲノム / 体細胞変異検出 / 次世代シークエンサー |
Outline of Annual Research Achievements |
1. 複数の特徴を階層ベイズモデルの中で考慮に入れた体細胞変異検出手法の開発. 去年度は論文執筆を行い、国際誌 Bioinformatics に論文投稿を行った。 今年度は査読者からの返信を受け追加実験や論文の更正を行い、投稿から11ヵ月かけ、 2019/02/28に論文の採択通知を受けた。 2. 複数のがん細胞のシークエンスデータを使う, 高精度な変異検出手法の開発. 去年度は、上記手法に関しての大まかなモデル化のアイデアを発着し、非常に簡単なシミュレーションにより、動作確認をしていた。 今年度は、評価の部分とモデル化の部分に関して、より詳細な検討を行い、上記手法の研究開発を進めた。 評価では、 入力行列を直接シミュレーションする方法ではなく、実データをもとにシークエンスデータをシミュレーションにより生成させる方法により、評価した。また、シークエンスデータを開発中の手法の入力に変換するソフトウェアは存在しないため、3000行程度のソフトウェアを新たに自作。 モデル化の部分に関しては、i) シークエンスデータに細胞の混合がある場合、 ii) 同じシークエンスデータが入力に含まれる場合の二つに関して、より詳細な検証を行った。 i) の場合に関して、がんの進化系統樹が単一である仮定のもとで、変異がどのデータに存在するかを表す変異パターンは、進化系統樹の葉の数の2倍程度しか存在しないという性質がわかった。そのため i) の場合においても、クラスタリングにより真の変異箇所とエラーを判別する本手法のモデル化が有効である予想を立てることができた。ii) の場合、去年度のモデル化ではバイクラスタリングをうまく行うことはできなかった。そこで、行方向のクラスタリングを階層的なクラスタリングに拡張し、同一のシークエンスデータを一つにまとめた上でバイクラスタリングを行うように、拡張した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
・複数の特徴を階層ベイズモデルの中で考慮に入れた体細胞変異検出手法の開発 去年度は論文執筆を行い、国際誌 Bioinformatics に論文投稿を行った。 今年度は査読者からの返信を受け追加実験や論文の更正を行い、投稿から11ヵ月かけ、2019/02/28に論文の採択通知を受けた。
・複数のがん細胞のシークエンスデータを使う, 高精度な変異検出手法の開発 去年度は、上記手法に関しての大まかなモデル化のアイデアを発着し、非常に簡単なシミュレーションにより、動作確認をしていた。今年度は、評価の部分とモデル化の部分に関して、より詳細な検討を行い、上記手法の研究開発を推し進めた。
|
Strategy for Future Research Activity |
本研究課題の一つの大きな目標は以下の3つの変数を用い、 T)->S)->D)の依存関係をもつ生成モデルを作成することである。T) 木構造の状態を表す潜在変数、 S)体細胞変異変異の状態を表す潜在変数、 D)実際のシークエンスデータを表す観測変数。前年度までに、S)->D)の生成モデルに関しては、修士課程までに作成していたモデルの拡張を行い、国際誌にて採択され、T)->S)の生成モデルに関しては、複数の生成モデルの検討を行い、実データを元にした精緻なシミュレーションをもとに評価を行うことができた。 これらを踏まえて今年度では以下の研究を執り行う。 1 実データを元にした精緻なシミュレーションだけではなく、 完全な実データのみによる評価実験の検討。前年度までの調査で、公開されている実データだけでは十分な評価ができない可能性があることがわかったため、実データの採取なども必要に応じて検討を行う。 2 構築した T)->S)->D) 依存関係を持つ生成モデルに対する評価実験や生成モデルの詳細などをまとめた学術論文を執筆する。 3 構築した T)->S)->D) 依存関係を持つ生成モデルを用いた推定が他の研究者からも利用可能にするために、作成したプログラムを公開し、ソフトウェアとしてまとめる。
|