研究課題/領域番号 |
17K00398
|
研究機関 | 東京大学 |
研究代表者 |
木立 尚孝 東京大学, 大学院新領域創成科学研究科, 准教授 (80415778)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 一細胞シーケンシング / 制御工学 / バイオインフォマティクス / 機械学習 / カルマンフィルター / RNA-seq |
研究実績の概要 |
本研究では、制御工学分野で発展した、連続時間非線形カルマンフィルターを整備とソフトウェア開発を行う。これにより例えば、一細胞RNA-seqデータから遺伝子間相互作用強度を推定するなど、生物の状態変化を引き起こすメカニカルな機構を解明し、異なる初期状態に対し、生命状態がどう遷移するか、などを予測可能にする。また、カルマンフィルターモデルが含む制御変数を人工的遺伝子過剰発現や外部環境刺激に対応させることで、生命を細胞レベルで自在に制御する工学技術へ向けた理論的基盤の確立を目指している。平成29年度は、カルマンフィルタのパラメータを、機械学習の一手法である、期待値最大化法で学習するアルゴリズムの開発及び実装を行った。この結果、時系列のレプリケート数がパラメータ推定の精度に大きく影響することが分かった。また、データの分散を表すパラメータの推定はデータが大きくないと難しいことなどが明らかになった。これと並行して、カルマンフィルターの確率密度の中心座標の時間発展からパラメータ推定を行う4D-Varの実装を行った。この手法はカルマンフィルターの確率分布の分散を捉えることはできないものの、非線形方程式への拡張が簡単に行えるという利点がある。このモデルでは、最適パラメータ周辺で尤度を計算することにより、パラメータ推定の信頼区間を計算できるようにしており、より確実に決まるパラメータを抽出することができるようになっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
カルマンフィルターについては実装も終わり、人工データによるバリデーションも行っていることから、かなりの進展があったと考えて良いと思われる。また、4D-Varによるパラメータ推定は、気候研究分野では古くから知られていたものの、生命データ解析ではほとんど見かけることはなく、新規性の高い研究になることが見込まれる。一方で、開発した手法を実データに適用することは現時点でできておらず、今後の課題となっている。
|
今後の研究の推進方策 |
開発したカルマンフィルターのパラメータ推定アルゴリズムを、稲の経時的トランスクリプトームデータに適用することで、実データにおける本手法の有効性を検証することを計画している。また、4D-Varのアルゴリズムについては、人工データを用いて、パラメータ推定の精度や計算された信頼区間の精度の検証が必要である。このほか、カルマンフィルターの制御変数を最適化して目的の状態変化を得る手法の検証を行っていくことも計画している。
|
次年度使用額が生じた理由 |
当初は本年度に実データの解析を行うはずであったが、本年度は主にアルゴリズムの開発と実装に費やした。このため、実データ解析に必要なRA謝金やノートPCの購入を次年度に持ち越すことにした。
|