本研究は網羅的実験により、「環境情報-細胞動態」のデータベースの構築および機械学習による培養・培地条件の予測モデルの開発を目指している。実験科学と情報科学に両面において、方法論の確立・開発が必要である。具体的には、1)実験系の確立、2)データの蓄積、3)学習プログラムの開発、4)検証の 4項目がある。2021年度には1)実験系の確立を達成した。2022年度には2)データの蓄積:培地種類や実験操作の詳細といった環境因子を網羅的に変化させ、細胞の増殖速度、細胞密度、細胞サイズや形状など細胞培養の良し悪し を表す多様な指標を計測し、環境情報‐細胞動態のビッグデータを取得した。計測手法の高精度化とデータ処理の高速化をさらに改良することにより、実験デー タの蓄積を加速させ、細胞培養のビッグデータを整備した。同一モデル細胞Hela-S3に対し、二種類計測方法(生化学反応、粒子分布)にを用いて、それぞれ数 百種類の培地の組合せ条件下での細胞培養(増殖)の結果が得られてた。 3)学習プログラムの開発:実験データに機械学習を適用することにより、細胞培養の分析と予測を行った。微生物細胞を対象に開発したプログ ラムを改変し、培養細胞の特徴に合わせ、アクティブラーニングの手法を確立した。学習モデルの予測精度を高めたことにより、培地最適化が成功した。 2022年度には4)検証:これまでの実験と学習分析により、個々の環境因子がどの程度、どのように細胞動態(培養の良し悪し)を決めるのかを明らかにした。これまでの成果をまとめ、論文執筆し投稿した。 ほかの細胞株を対象に、最適化培地および学習モデルのの汎用性を評価し、当初の計画にない内容として、トランスクリプトーム解析を試みた。研究成果として、国際誌学術論文を複数投稿し、学会発表を多数実施した。
|