DNAシーケンシング技術やカメラ性能の向上により生物過程の時空間情報が急増している。これにより遺伝子間相互作用の時間的因果関係や、細胞・組織の3次 元的配置が生物の振る舞いへ与える効果などを厳密に調べることが可能になってきた。そこで本研究では、生命過程のより高度なモデリングを可能にするための 道具として、非線形確率偏微分方程式のパラメータをデータから推定する汎用的な機械学習技術の開発・実装を行うことを目標としている。我々の手法により、 既知の自然法則を機械学習モデルに取り込むことが容易になり、時空間データから生物状態変化を引き起こすメカニカルな機構を推定する研究が広まることが期 待される。2023年度は生成AIの一種である拡散過程を用いた確率モデルの推定法の研究を行った。変分オートエンコーダーの枠組みを用いて変分下限値を最大化することによりライト・フィッシャーモデルのパラメータの最適化を行うソフトウェアを作成した。次に真のライト・フィッシャーモデルを用いて観測データをシミュレーションにより生成し、本ソフトウェアによりパラメータを推定することを試みた。その結果、推定されたパラメータ値は、多くの場合データを生成したパラメータ値とはかなり異なったものになることがわかった。これは変分関数は多層のニューラルネットワークを用いても真のモデルの条件付き確率を表現するには十分な柔軟性を持たないため、真のモデルとの変分関数とのずれが、パラメータ推定値のずれにつながると考えられた。このため変分オートエンコーダーではなく真の尤度を直接計算するアルゴリズムの開発が今後の課題と考えられる。
|