2021 Fiscal Year Annual Research Report
深層学習を用いた形質推定アルゴリズムの開発と有用品種のデザイン
Project/Area Number |
20J20016
|
Research Institution | Waseda University |
Principal Investigator |
松谷 太郎 早稲田大学, 先進理工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | がん / ベイズ統計 / 変異シグネチャー / 腫瘍内不均一性 |
Outline of Annual Research Achievements |
前年度に引き続き、がんゲノムのbulk whole-genome sequencingのデータから、腫瘍内不均一性を推定するためのソフトウェアの開発に尽力した。腫瘍内不均一性を推定するために開発されてきたこれまでの先行手法の多くは、1つ1つの一塩基多型のVariant Allele Frequency (VAF)に基づいてどのような順番でゲノムに変異が蓄積したかを推定する手法が多い。それらに対して我々の提案手法では、VAFだけでなく、その一塩基多型の周囲にどのような塩基が存在するのかに着目し、変異シグネチャーと呼ばれる概念を用いて確率的にモデリングを行った。同じモチベーションの類似手法と比較して、提案手法は各パラメータが共役な事前分布を持っていることからノイズにロバストなモデルとなっており、シミュレーションデータを用いた実験では、既存手法よりも高精度に腫瘍内不均一性を推定することに成功し、またモデル選択に該当するクローン数の推定に関しても既存手法を上回る性能を出した。 また、提案手法は腫瘍内不均一性を推定するだけにとどまらず、変異シグネチャー解析の観点からもVAFを利用することによって高精度なシグネチャー割り当てを可能にしている。PCAWGプロジェクトに登録された慢性リンパ性白血病のサンプルを用いた実データ解析では、Activation-induced cytidine deaminaseと関連すると云われているSBS9というシグネチャーが免疫グロブリンをコードしている領域に集中して変異を引き起こしていることを示した。これは近年の研究によって明らかになった知見と一致し、提案手法の有効性が示されたと考えている。 これらの研究成果をまとめ、NAR Genomics and Bioinformaticsで誌上発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究実績の欄にも書いたように今年度は腫瘍内不均一性の推定を行うソフトウェアの開発に注力した。開発したソフトウェアはgithub上で公開されており、今後も性能評価等を行っていく予定である。 また、新たなテーマとして「変異クラスに依存しない階層ベイズモデルに基づくがんゲノムのIndelシグネチャー決定」について研究を進めた。現在同定されている変異シグネチャーは、予め定義された変異クラスに基づいて非負値行列因子分解を行うことで得られたものであり、例えばリピート特異的な変異を引き起こすような変異プロセスに対応した変異シグネチャーを推定することは難しい。これを解決するため、Markov Random Field (MRF)を用いてゲノム中の任意のリピート領域に引き起こされた変異のパターンをモデリングするような新規手法を開発した。しかし、MRFのパラメータ推定において潜在変数の状態空間が高次元過ぎるために、ニュートン法に代表されるような数値解析的なアプローチでは最適な解にたどり着けないことがシミュレーション実験を通して分かった。 これらの成果についてはIIBMP2021にて学会発表を行なっている。
|
Strategy for Future Research Activity |
今年度は新たに「変異シグネチャーを利用した、ノンパラメトリックベイズに基づく、がんゲノム中の変異の系統解析」に着手する予定である。がんゲノムの進化史を決定することは、どのような順序で変異が蓄積したかを決定することと言い換えられるが、現在存在する多くの既存手法はbulk sequencingされたデータから変異をコールして解析を行うことが多い。bulk-sequencingよりも高解像度な情報を得ることができるmultiple sequencingやsingle-cell sequencingのデータ基盤が整いつつある現在、それらのシーケンシング技術により適した解析ツールが求められており、それを開発することを目指す。bulk-sequencingと比較したときのsingle-cell sequencingの問題としてdepthの低さが挙げられ、これを改善するためにはdepthだけでない変異タイプの情報を参照したり、depthを得るための確率分布に対して適切な事前分布を置くようなアプローチが有効であると考えられる。我々はノンパラメトリックベイズを用いて任意の系統構造に対応できるようなsingle-cell sequencingデータの解析手法を考案中であり、これに変異シグネチャーの概念を組み合わせることで更に高精度ながんゲノム進化史推定ソフトウェアの開発に繋がると考えている。
|
Research Products
(3 results)