2019 Fiscal Year Research-status Report
GenomeGAN: in silico genome design with generative adversarial networks
Project/Area Number |
19K22897
|
Research Institution | Keio University |
Principal Investigator |
佐藤 健吾 慶應義塾大学, 理工学部(矢上), 講師 (20365472)
|
Project Period (FY) |
2019-06-28 – 2021-03-31
|
Keywords | バイオインフォマティクス / ゲノム合成 / 敵対的生成ネットワーク / 深層強化学習 |
Outline of Annual Research Achievements |
合成生物学は,生命を再構成することによってその完全な理解を目指す究極のアプローチであると同時に,生物の工学的な応用に繋がることからその産業的な価値も極めて高い.しかし,生命として完全に機能するゲノム配列を設計して,人工的な生命を合成することは困難を極める挑戦的な課題である.本研究では,人工知能・機械学習の最先端技術である敵対的生成ネットワーク (Generative Adversarial Networks; GAN) や深層強化学習による生成モデルを合成生物学に応用し,計算機を用いたゲノム設計の全く新しい手法(インシリコゲノム合成)を開発する.これにより,これまでゲノム配列の決定だけでは決してなし得なかった生命のシステム的理解への到達を目指す.本年度はその前段階として,ある特定の二次構造を形成するRNA配列を設計するRNA配列設計問題に取り組んだ.深層強化学習を塩基配列空間の探索の最適化のための学習手法として用いることで,ターゲットの二次構造に対するより効率的な塩基配列の生成が可能になる.本研究では,二次構造の情報を明示的に扱うための構造化ニューラルネットワークを導入することによる,RNA配列設計における予測性能への効果を調査した.構造化の表現方法としてグラフCNNや木構造LSTMを用いたところ,速度ではグラフCNNが勝るものの,木構造LSTMの方がターゲット二次構造に近い二次構造を形成する配列が得られる結果となった.しかしながら,現時点では十分な精度とは言えず,改善の余地が残る.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
初年度予定していた遺伝子配列の生成を十分な精度で行うアルゴリズムが完成していないため,本研究の進捗はやや遅れていると言える.
|
Strategy for Future Research Activity |
本年度実装した深層強化学習による生成モデルに加え,敵対的生成ネットワークや変分オートエンコーダによる生成モデルを実装し,より高精度の配列生成を目指す.さらに,大規模な学習により,インシリコゲノム生成を実現する.
|
Causes of Carryover |
(理由) 計算機の購入ではなく,外部スーパーコンピュータの利用に切り替えたため. (使用計画) 外部スーパーコンピュータの利用をさらに促進するともに,研究成果発表のための旅費および論文投稿料を当初の予定よりも増やす.
|
Research Products
(3 results)