研究課題/領域番号 |
25730135
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 (2015) 大阪大学 (2013-2014) |
研究代表者 |
植野 剛 東京大学, 新領域創成科学研究科, 特任研究員 (90615824)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2015年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2014年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2013年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 強化学習 / データ同化 / 機械学習 / 人工知能 / ベイズ最適化 / 創薬 / 確率最適制御 / 最適制御 / 統計学習 |
研究成果の概要 |
計算機シミュレーションの結果から行動戦略を学習することは,多大なコストが発生する「実験」を行なう必要がないため,飛躍的な生産性の向上が見込まれる. しかし,シミュレーションの結果は実際の実験結果から乖離することも少なくなく,シミュレーションで得た戦略が実際に意味をなさないことも多い.本研究では,シミュレーション学習の枠組みであるデータ同化と,データから意思決定則を学習する強化学習を組み合わせた「データ同化強化学習」を開発し,少ない実験数で高い性能を発揮する行動戦略の学習を実現した.また,開発した手法を新規材料設計問題に応用し,従来法より少ない実験数で目標とする物質を見つけることに成功した.
|