研究課題/領域番号 |
19K22897
|
研究機関 | 慶應義塾大学 |
研究代表者 |
佐藤 健吾 慶應義塾大学, 理工学部(矢上), 講師 (20365472)
|
研究期間 (年度) |
2019-06-28 – 2022-03-31
|
キーワード | バイオインフォマティクス / ゲノム合成 / 敵対的生成ネットワーク / 深層強化学習 |
研究実績の概要 |
合成生物学は,生命を再構成することによってその完全な理解を目指す究極のアプローチであると同時に,生物の工学的な応用に繋がることからその産業的な価値も極めて高い.しかし,生命として完全に機能するゲノム配列を設計して,人工的な生命を合成することは困難を極める挑戦的な課題である.本研究では,人工知能・機械学習の最先端技術である敵対的生成ネットワーク (Generative Adversarial Networks; GAN) や深層強化学習による生成モデルを合成生物学に応用し,計算機を用いたゲノム設計の全く新しい手法(インシリコゲノム合成)を開発する.これにより,これまでゲノム配列の決定だけでは決してなし得なかった生命のシステム的理解への到達を目指す.本年度はその前段階として,ある特定の二次構造を形成するRNA配列を設計するRNA配列設計問題に取り組んだ.まず,主にTransformerで構成されるEncoder-Decoderモデルを深層強化学習アルゴリズムを用いて学習させた.また,新規の手法として,RNA配列を直接的に最適化するために,微分可能なRNA配列を生成する深層学習モデルを構築し,エネルギースコアを組み込んだ損失関数を用いて学習させた.これは,従来手法で塩基の選択のために用いられていたSoftmax関数をGumbel-Softmax関数に置き換えることで,微分可能な塩基配列の生成を可能としたモデルである.いずれの手法も,損失関数の値の推移と評価実験の結果から効率的な学習が難しく予測精度の向上は見られず,改善の余地が残る.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度に予定していたRNA逆フォルディングによるRNA配列の生成を十分な精度で行うアルゴリズムが完成していないため,本研究の進捗はやや遅れていると言える.
|
今後の研究の推進方策 |
本年度実装した深層学習による生成モデルに加え,敵対的生成ネットワーク・変分オートエンコーダやActivation-Maximizationによる生成モデルを実装し,より高精度の配列生成を目指す.さらに,大規模な学習により,インシリコゲノム生成を実現する.
|
次年度使用額が生じた理由 |
(理由) コロナ禍のために,研究成果発表のための旅費を使用できなかったため. (使用計画) 外部スーパーコンピュータの利用をさらに促進するともに,研究成果発表のための論文掲載料を当初の予定よりも増やす.
|