研究課題/領域番号 |
17K00335
|
研究機関 | 東京工業大学 |
研究代表者 |
小野 功 東京工業大学, 情報理工学院, 准教授 (00304551)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | ブラックボックス最適化 / 大域的多峰性 / 関数最適化 / 進化計算 / 自然進化戦略 / 多目的最適化 / 逐次状態推定 / 政策最適化 |
研究実績の概要 |
本年度の主な研究成果は以下の研究1~7のようにまとめられる.研究1では,非連結なUV 関数を考慮した進化計算手法を提案した.ベンチマーク関数および実問題への適用を通じて,有力な既存手法であるCPIEおよびNMMSOよりも優れた探索性能を示すことを確認した.研究2では,多目的ブラックボックス関数最適化のための転移学習に基づくマルチスタートスカラー化自然進化戦略を提案した.提案手法は,ベンチマーク問題および実問題である複数車種の同時最適化問題において,通常のマルチスタートスカラー化自然進化戦略よりも優れた探索性能を示すことを確認した.研究3では,月着陸ミッションの最適着陸地点の選定問題のための自然進化戦略を提案した.提案手法は進化計算コンペティション2018単目的最適化部門で優勝した.研究4では,吊り下げ型輸送ドローン制御のための人のスキルを用いた自然進化戦略に基づく転移学習手法を提案し,少ない教師データからロバスト性の高い制御則を効率よく獲得できることを示した.研究5では,微分方程式系推定のための分布学習アルゴリズムの提案を提案した.3つのベンチマーク問題への適用を通じて,提案手法は有力な既存手法である遺伝的プログラミングよりも効率よく式を発見できることを示した.研究6では,逐次状態推定問題における未知パラメータの推定のため,粒子の多様性を交叉により導入する粒子フィルタを提案した.ベンチマーク問題への適用を通じて,提案手法が既存手法よりも高い推定精度を得られることを示した.研究7では,連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法を提案した.多峰性景観環境のベンチマーク問題において,最も有力な既存手法として知られるProximal Policy Optimization (PPO)よりも安定して優れた政策を得られることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度は,昨年度に提案した大域的多峰性関数最適化のための自然進化戦略に基づく進化計算手法では解決が困難である非連結なUV 関数を考慮した新たな進化計算手法を提案し,ベンチマーク関数および実問題において既存手法よりも優れた探索性能を示すことを確認できた.また,昨年度に提案した高次元問題のための自然進化戦略のロバスト性を高めた手法を提案し,月着陸ミッションの最適着陸地点の選定問題を対象とした進化計算コンペティション2018単目的部門にて他手法を凌駕する性能を示すことができた.さらに,昨年度に提案した複数車種の構造設計の多目的同時最適化問題のための転移学習に基づくマルチスタート自然進化戦略を改良した手法を提案し,複数車種の構造設計だけでなく,ベンチマーク問題でもその有効性を確認できた.以上より,当初の目的を達成できたと考えている.さらにこれに加えて,吊り下げ型輸送ドローン制御のための人のスキルを用いた自然進化戦略に基づく転移学習手法,微分方程式系推定のための分布学習アルゴリズム,未知パラメータの推定における粒子の多様性を考慮した粒子フィルタ,連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法を提案し,数値実験によりそれぞれで既存手法を凌駕する性能を確認できた.特に,微分方程式系推定のための分布学習アルゴリズムに関する研究は,計測自動制御学会システム・情報部門学術講演会2018(SSI2018)においてSSI最優秀論文賞を受賞した.以上より,当初の計画以上に進展していると判断した.
|
今後の研究の推進方策 |
平成31年度は,平成30年度に提案した非連結なUV 関数を考慮した新たな進化計算手法を,多目的最適化へ拡張する研究を行う予定である.また,平成30年度に提案した月着陸ミッションの最適着陸地点の選定問題のための自然進化戦略について,より高次元の問題への適用を目指して,さらなる探索の効率化を行う予定である.また,これまでの研究成果をまとめて,学術論文に投稿を行う予定である.
|
次年度使用額が生じた理由 |
[理由] 学術論文の投稿が間に合わなかったため. [使用計画] 学術論文の掲載料および別刷り料に充てる予定である.
|