2020 年度実績報告書

機械学習による多体力学系の解空間構造抽出と大域的軌道最適化への応用

研究課題

研究課題/領域番号	19J22024
研究機関	東京大学
研究代表者	柳田幹太東京大学, 工学系研究科, 特別研究員(DC1)
研究期間 (年度)	2019-04-25 – 2022-03-31
キーワード	大域的最適化 / 軌道設計 / 強化学習 / 深層学習
研究実績の概要	昨年度は深層強化学習を用いて比較的シンプルな円制限三体問題の軌道探索を自動化する枠組みの提案を行った。強化学習によって研究目的の一つ「探索結果の学習による探索の効率化（単発性の解消）」は一部達成できたものの、強化学習は将来の情報を正確に予測することが苦手であり、探索精度や探索効率に課題があった。そこで今年度は、後の最適化を前提に初期軌道のみを強化学習で探索する枠組みの構築を目指した。強化学習の適用対象を初期軌道に絞ることで、探索精度や探索効率の抜本的な改善を図った。提案手法では軌道探索を二段階に分割し、それぞれ軌道の初期解生成を行うアウターループと最適制御理論に基づく最適化を行うインナーループとした。アウターループは柔軟な軌道生成が行えるように深層生成モデルで構築され、インナーループでの最適化後に良い局所解が得られやすいような「良い初期解分布」となるよう、強化学習によって訓練される。制御理論の厳密さや透明性を取り入れ、研究目的の一つ「解を得た過程の可視化（不透明性の解消）」にも繋がる内容であり、今後toy problemによる詳細な検証と円制限三体問題の軌道探索への応用が重要となる。
現在までの達成度 (段落)	翌年度、交付申請を辞退するため、記入しない。
今後の研究の推進方策	翌年度、交付申請を辞退するため、記入しない。