研究課題/領域番号 |
19K22897
|
研究機関 | 慶應義塾大学 |
研究代表者 |
佐藤 健吾 慶應義塾大学, 理工学部(矢上), 講師 (20365472)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
キーワード | バイオインフォマティクス / ゲノム合成 / 敵対的生成ネットワーク / 深層強化学習 |
研究実績の概要 |
合成生物学は,生命を再構成することによってその完全な理解を目指す究極のアプローチであると同時に,生物の工学的な応用に繋がることからその産業的な価値も極めて高い.しかし,生命として完全に機能するゲノム配列を設計して,人工的な生命を合成することは困難を極める挑戦的な課題である.本研究では,人工知能・機械学習の最先端技術である敵対的生成ネットワーク (Generative Adversarial Networks; GAN) や深層強化学習による生成モデルを合成生物学に応用し,計算機を用いたゲノム設計の全く新しい手法(インシリコゲノム合成)を開発する.これにより,これまでゲノム配列の決定だけでは決してなし得なかった生命のシステム的理解への到達を目指す.本年度はその前段階として,ある特定の二次構造を形成するRNA配列を設計するRNA配列設計問題に取り組んだ.深層強化学習を塩基配列空間の探索の最適化のための学習手法として用いることで,ターゲットの二次構造に対するより効率的な塩基配列の生成が可能になる.本研究では,二次構造の情報を明示的に扱うための構造化ニューラルネットワークを導入することによる,RNA配列設計における予測性能への効果を調査した.構造化の表現方法としてグラフCNNや木構造LSTMを用いたところ,速度ではグラフCNNが勝るものの,木構造LSTMの方がターゲット二次構造に近い二次構造を形成する配列が得られる結果となった.しかしながら,現時点では十分な精度とは言えず,改善の余地が残る.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
初年度予定していた遺伝子配列の生成を十分な精度で行うアルゴリズムが完成していないため,本研究の進捗はやや遅れていると言える.
|
今後の研究の推進方策 |
本年度実装した深層強化学習による生成モデルに加え,敵対的生成ネットワークや変分オートエンコーダによる生成モデルを実装し,より高精度の配列生成を目指す.さらに,大規模な学習により,インシリコゲノム生成を実現する.
|
次年度使用額が生じた理由 |
(理由) 計算機の購入ではなく,外部スーパーコンピュータの利用に切り替えたため. (使用計画) 外部スーパーコンピュータの利用をさらに促進するともに,研究成果発表のための旅費および論文投稿料を当初の予定よりも増やす.
|