研究課題/領域番号 |
19K14591
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分12040:応用数学および統計数学関連
|
研究機関 | 東京理科大学 (2021) 大阪大学 (2019-2020) |
研究代表者 |
犬伏 正信 東京理科大学, 理学部第一部応用数学科, 准教授 (20821698)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
中途終了 (2021年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 流体混合 / 強化学習 / 非線形力学系 / カオス / 最適化 / 機械学習 / 非線形力学 / 人工知能 |
研究開始時の研究の概要 |
流体混合は多種多様な工学応用上で重要であるにも関わらず,古くから試行錯誤やノウハウに頼っている部分が多く, 最適化されているとは言い難い.一方,強化学習の方法は最適な制御法を得るための機械学習法であり,近年著しく発展している.そこで本研究では強化学習を用いて流体混合を最適化する.従来法の単純な応用ではなく,流れの物理(運動方程式)による演繹的な方法と,機械学習による帰納的な方法を組み合わせることで,新しい流体混合手法を確立する.さらに得られた最適な流れの特徴を抽出することで効率的な混合の本質的機構を見出し,撹拌器設計等の工学応用に繋げる.
|
研究実績の概要 |
流体混合は多種多様な工学応用上で重要であるにも関わらず,古くから試行錯誤やノウハウに頼っている部分が多く, 数理的に最適化されているとは言い難い.一方,強化学習は時間大域的な最適化問題に有効であり,近年著しく発展しているが,その応用は未だ限定的である.そこで本研究では,流体混合の問題が時間大域的な問題であることに注目し,強化学習を用いて流体混合を最適化する手法を確立した. 具体的には,対象とする流体混合の問題設定を定式化し,流体混合最適化のための深層強化学習(Deep Q-Network)プログラムを実装,ベンチマーク問題に対して最適化を行い有効性を示した.また,強化学習によって得られた最適混合操作が物理的にも理に適っていることを見出した. また,濃度場の時間発展に拡散の効果も取り入れた場合(有限のペクレ数)についても強化学習による最適化を行った.その結果,高ペクレ数で学習を行った結果(Deep Q-Network)は低ペクレ数の場合にも転用可能であること,その逆は必ずしも有効でない(転用可能でない)ことを明らかにした.このことは将来的に強化学習を混合問題へ適用する際に重要な設計指針となり得る.この転用可能性については(当初の計画にはなかった)転移学習の研究成果から派生したものであり,転移学習法についての結果を含め国際学術誌や学会にて成果発表を行った.最終的な総合報告として,2022年にScientific Reports誌に成果を掲載し,さらにEurekAlert!等を通して研究の成果や重要性について分かりやすく発表した.
|