計算機シミュレーションの結果から行動戦略を学習することは,多大なコストが発生する「実験」を行なう必要がないため,飛躍的な生産性の向上が見込まれる. しかし,シミュレーションの結果は実際の実験結果から乖離することも少なくなく,シミュレーションで得た戦略が実際に意味をなさないことも多い.本研究では,シミュレーション学習の枠組みであるデータ同化と,データから意思決定則を学習する強化学習を組み合わせた「データ同化強化学習」を開発し,少ない実験数で高い性能を発揮する行動戦略の学習を実現した.また,開発した手法を新規材料設計問題に応用し,従来法より少ない実験数で目標とする物質を見つけることに成功した.
|