研究課題
1細胞技術の発展により、個々の細胞の網羅的な発現量を調べることが可能となった。このような1細胞データを用いることで、これまでのデータでは困難であった様々な解析が可能となった。その中で、分化過程を再構築する研究が注目を集めている。この研究では、次元圧縮などを用い分化経路および各細胞の分化進行度を推定している。この分化進行度は偽時間と呼ばれ、偽時間に対する発現変化をクラスタリングした結果から、分化に関わる遺伝子制御の上流下流のカスケードが推定できることが示されている。また、1細胞発現データはバルクでは細胞の混在により不明確になっていた共発現パターンを検出できる。このように1細胞データは遺伝子間の関係の解析において有効なデータであると期待される。1細胞発現データを用いた先行研究では、上述のように発現ダイナミクスや共発現パターンを基盤とした解析が行われていた。それら研究の次のステップとして、発現ダイナミクスや共発現の制御、つまり遺伝子間制御ネットワークの解明が挙げられる。ここで偽時間を時間情報と捉えると、scRNA-seqは分化過程の密な時系列データと考えることができる。時系列データは因果関係、すなわち制御ネットワークを推定する上で重要なリソースである。よって、時系列を適切に取り込み制御ネットワークを推定することが大切となる。これまで、生物学にとどまらず様々な分野で時系列データから制御ネットワークを推定する研究がなされてきたが、それら研究では離散的な時系列データなどの仮定をしており、また実行時間の観点からも大量の細胞と遺伝子を含むscRNA-seqデータに適したアルゴリズムは存在しなかった。そこで本研究では、連続時間の大量の細胞と遺伝子を含む発現データから、効率的に制御ネットワークを推定するための新しいアルゴリズムの開発を行った。
1: 当初の計画以上に進展している
scRNA-seqから効率的に制御ネットワークを推定可能とするアルゴリズムとして、多変量線形常微分方程式に基づくモデル化と、低次元の線形微分方程式からの変数変換と線形回帰を用いた効率的なパラメータ(制御ネットワーク)の最適化法を確立した。構築したアルゴリズムを3つのscRNA-seqデータセットに対し本手法を適用したところ、活性化、不活性化の発現ダイナミクスはもちろん、一過的な活性化などを正しく再現できる微分方程式を学習できていることがわかった。また、ネットワークの推定性能の検証のため、異なる実験データから構築された制御ネットワークデータベースと比較したところ、本手法はこれまでのネットワーク推定によく用いられている手法と比較し、おおよそ全ての場合で一番良い性能を示した。また、実行時間においても、本手法は時系列情報を用いた既存手法に比べ非常に高速であることはもちろん、時系列情報を含んでいない手法とも同等であることが確認された。以上のように昨年度はscRNA-seqから効率的かつ性能の良い制御ネットワーク推定法を構築することに成功し、またそれら結果はまとめた論文はBioinformatics誌に受理された。
最近では、臓器やオルガノイドのように複数の細胞型が含まれるscRNA-seqデータが増加している。また、CRISPR/Cas9などの実験技術とscRNA-seqを組み合わせた効率的な摂動実験が提案された(Dixit, et al. 2016, Cell)。1細胞ごとにランダムな遺伝子の発現を活性・抑制化することで、遺伝子の制御関係を得る方法である。この摂動の影響で、複数の細胞型が生じることが想定される。今後、このような、単一の分化方向への制御ネットワークのみでなく、複数の方向への変化も考慮したモデルへ拡張することで、そのようなデータに対してもネットワークを推定できる手法を構築する。また、これまでのモデルと学習したパラメータを用いた上で、様々なシミュレーションから分化誘導因子などを探索するための枠組みを構築する。学習結果から、発現ダイナミクスを再現できるモデルが構築されており、このモデルに対して、ある遺伝子の発現量の初期値や制御ネットワークを変更した場合の挙動をシミュレーションすることが可能である。このようなシミュレーションを行うことで、様々な摂動実験が計算機上で可能であり、目的の細胞へ近づくような結果となる摂動パターンを探索することで、効率的な分化やダイレクトリプログラミング、臓器形成に有効な因子の同定が可能であると考えられる。
すべて 2017 2016
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (1件)
Bioinformatics
巻: 印刷中 ページ: 印刷中
10.1093/bioinformatics/btx194