研究課題/領域番号 |
20K12059
|
研究機関 | 東京大学 |
研究代表者 |
木立 尚孝 東京大学, 大学院新領域創成科学研究科, 准教授 (80415778)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 一細胞シーケンシング / バイオインフォマティクス / 確率微分方程式 / 機械学習 / トランスクリプトーム |
研究実績の概要 |
DNAシーケンシング技術やカメラ性能の向上により生物過程の時空間的情報が急増している。これにより遺伝子間相互作用の時間的因果関係や、細胞・組織の三次元的配置が生物の振る舞いへ与える効果などを精密に調べることが可能になってきた。そこで本研究では、生命過程のより高度なモデリングを可能にするための道具として、非線形確率偏微分方程式のパラメータをデータから推定する汎用的な機械学習技術の開発・実装を行うことを目的としている。我々の手法により、既知の自然法則を機械学習モデルに取り込むことが容易になり、時空間データから生物状態変化を引き起こすメカニカルな機構を推定する研究が広まることが期待される。2020年度は、時空間に依存するベクトル場のテンソル代数を計算機上で行う方法の開発を主に行った。それからベクトル場のファインマン汎関数積分を実行するアルゴリズムを開発した。その後微分方程式のパラメータを事後確率最大化法に基づき推定する手法を実装し、さらにパラメータ推定の信頼性を評価するアルゴリズムを実装した。最初に試したC++言語のテンプレート機能をフルに活用する実装では、コンパイル時間とコンパイル時の使用メモリが非常に大きく実用的な実装ではないことが明らかになった。このため実装をより伝統的なクラスの機能のみを利用するものに置き換えたところ十分に実用的な時間でコンパイルができることがわかった。さらにこの実装手法では動的にテンソル代数の表現式を最適化することが可能なため計算時間の短縮に効果的であることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2020年度の最大の課題は、場のテンソル代数をどのようなデータ構造として扱うかという点であったが、これは、加算オブジェクト、積演算オブジェクト、場オブジェクトなどをノードとして持つ有向非循環グラフとして実現することで全体をうまく実装することができた。十分なデバッグができていないものの、概ね本年度の課題は達成されたと考えている。
|
今後の研究の推進方策 |
現時点までで本課題の核となるアルゴリズムの開発及び実装はできたと考えている。今後は作成したソフトウェアのデバッグを行い、基本的な性能評価を行った後に、一細胞シーケンシングデータの解析など現在の生命情報学における重要なテーマへの応用を迅速に進めていく必要があると考えている。
|
次年度使用額が生じた理由 |
初年度にプログラミングが完了せず計算機実験を開始できなかったためパソコン購入費や追加の計算機使用料が生じなかった。翌年度以降は計算機実験を行うため当該年度分と翌年度分をパソコン購入費や計算機使用料として使う方針にしている。
|