研究課題
全エキソームシークエンスデータ解析のプラットフォーム「Genomon」を開発し,公開を行った.癌ゲノムデータにおける体細胞変異検出において,シークエンスdepthが低い時や腫瘍の割合が小さい時に,変異をシークエンスエラーと区別することは難しく,適切な統計的手法が必要となる.そこで,体細胞変異検出のための新しい方法論を開発した.提案手法においては経験ベイズ理論に基づいてシークエンスエラーの度合いのモデル化を行い,多数検体の非癌部データを用いてエラーモデルのパラメータを決定している.これにより各々のlociにおけるエラーの正確な評価が可能になり,depthが低い時,また腫瘍割合が小さい場合にも正確な変異検出をすることが可能になる.さらに, subcloneの検出も有効に行うことができる.本成果は国際学術誌に採録された.融合遺伝子は,癌の発病機序に大きな役割を果たしている.近年のハイスループットシークエンシング技術の発展により,網羅的に融合遺伝子を検出することが可能になりつつある.この目的のために全トランスクリプトームシークエンスデータから融合遺伝子を検出するための多くのアルゴリズムが提案されているが,リピートや相同配列により生じる偽陽性が未だに多いことなどの数多くの問題があり,性能の良いアルゴリズムの開発は未だに重要な課題である.そこで,融合遺伝子検出のための新しいプラットフォーム「Genomon-fusion」を開発し,公開した.本手法は,soft clippingリードの探索による候補の高感度検出と,偽陽性を除くための様々なフィルター備えており,既存の手法に比べ感度,正答率の点で勝っていることが実験的に確認されている.さらに,アノテーションが付与されていない新規の遺伝子や,ウイルス配列を含む融合遺伝子の検出が可能である.
2: おおむね順調に進展している
研究計画の①「変異比率の推定を含めた,ゲノム変異同定の方法論の開発」についてであるが,やはり現在のシークエンスデータのサンプル準備の実験プロトコルなどから,変異比率を偏りなく推定することは困難であり,計画の修正を迫られた.しかし,変異比率の不偏推定を試みたことで,シークエンスエラーの特性についての理解が深まり,システマチックエラーを統計的に扱った新たな後天的点変異の検出法の開発につながった.後天的点変異に加えて,トランスクリプトームシークエンスデータから網羅的に融合遺伝子を検出するための新しい方法論の開発も行うことができたことや,シークエンスデータ解析プラットフォーム「Genomon」の開発,公開ができたことを考えると,今年度の生産性は決して悪いものではないと考えられる.
研究計画の②「検出できなかった変異も含め,実際の点変異の総数を推定する方法論の開発」について現在研究室の同僚の研究員と共同研究が始まっているが,こちらを確実に進めていきたい.シークエンスデータのリード長が長くなりつつあるなど,ゲノムデータを取り巻く環境にも変化が表れてきている.こういった技術革新にも目を配り,引き続き広い意味で,癌の病態解明に役に立つような統計手法の開発を行っていきたい.
論文投稿料.国際学会での発表や共同研究のための旅費など.
すべて 2013 その他
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件) (うち招待講演 3件)
Nucleic Acids Research
巻: 41 ページ: e89
10.1093/nar/gkt126