2014 Fiscal Year Annual Research Report
同一染色体上に存在するSNPおよびエピジェネティック修飾の推定法の開発と機能解析
Project/Area Number |
13J06670
|
Research Institution | The University of Tokyo |
Principal Investigator |
松本 拡高 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2013-04-26 – 2016-03-31
|
Keywords | 1細胞RNA-Seq / 確率過程 / 遺伝子発現ダイナミクス |
Outline of Annual Research Achievements |
1細胞RNA-Seqの時系列解析に向けた確率モデルの構築を行った。先行研究の調査の結果、確率過程の一つであるOU過程が発現変動をモデル化することに適していると考え、適応を試みている。OU過程は変数がアトラクタへ向かう一方でノイズによる影響も受けるモデルであり、組織特異的な発現量や発現ノイズを考慮した上で発現量の時刻変化をモデル化する上で優れていると考えられる。OU過程は表現型の進化などに用いられてきたが、発現データに適応するにあたっていくつか計算上改良すべき点があった。そのため、本年度はそのような計算上の困難を、OU過程を微小時間に分割しその積を考えることで解決した。このとき微小時間への分割の程度に依存したパラメータ最適化法では実行時間が大きくなると予想されたため解析的に解く方法を検証した。解析的に解くにあたっては、分散共分散行列が三重対角行列になりかつその逆行列が求まることを利用し各地点での平均などが求まることを示しそれら値を用いてQ関数を最大化する更新式を得た。さらに細胞分化の分岐を表現するためOU過程を混合化した上での最適化法を確立した。現在はプログラミングの実装、改良とともに発生初期における細胞分化の発現データでの検証を行っている。また1細胞RNA-Seqでは時系列ではなく、一時点におけるデータを収集するものも多い。これら同一時刻データ中の各細胞は生物学的な時間の観点からは異なると考えられ、細胞間の類似性から擬似的な時間pseudotimeを計算する研究が近年行われてきた。これまでのpseudotimeの研究では発現量の高次元空間を低次元に落とした上での細胞間の距離で計算された。一方で我々のOU過程は低次元に落とすことなく発現をモデル化しており時間パラメータを最適化することでpseudotimeを計算する異なるアプローチを提示できる可能性があり有効性を検証中である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の目的である1細胞RNA-Seqの時系列解析法の構築に向け、OU過程を用いた発現ダイナミクスのモデル化とパラメータ最適化法の構築を行った。パラメータ最適化法の研究において、超離散化によってパラメータを解析的に求める方法を式展開を念密に行って求めたが、その性質から精度のオーダーを正確に保ちつつ正しく計算していく必要が判明し、非常に複雑な式を扱う必要が出てきた。そのため、当初予定していたよりパラメータ最適化法の構築が遅れ、結果として実データへの適用が遅れてしまった。ただし、実データへの適用後はdifferential expressionの定量化などの各種手法の構築と検証はおおむね順調にいっており、結果として計画の遅れは少しであり問題にはならない。
|
Strategy for Future Research Activity |
さらに、全遺伝子を同時に考慮した多変量OU過程への拡張を行う。これまでの細胞分化モデルでは遺伝子を独立にモデル化しているが、全遺伝子を同時に考慮することで遺伝子発現の因果関係を推定できると考えられる。そのため、多変量OU過程を時系列発現データに適応することで、遺伝子制御構造を推定できると期待できる。これまで時系列発現データに関する解析としては主に相関解析が利用されてきた。また因果関係を推定する手法としてはBayesian Networkを用いた手法などが挙げられるが、コンピュータ上での計算量が大きく非常に大きな計算資源を必要とした。多変量OU過程も一変量OU過程と同様に解析的に解くことができると期待され、本手法は因果関係を少ない計算量で推定できる非常に有力な手法となり得ると期待している。
|
Research Products
(3 results)