2018 Fiscal Year Research-status Report

未知解探索のための大規模最適化基盤の構築

Research Project

Project/Area Number	17K00335
Research Institution	Tokyo Institute of Technology
Principal Investigator	小野功東京工業大学, 情報理工学院, 准教授 (00304551)
Project Period (FY)	2017-04-01 – 2020-03-31
Keywords	ブラックボックス最適化 / 大域的多峰性 / 関数最適化 / 進化計算 / 自然進化戦略 / 多目的最適化 / 逐次状態推定 / 政策最適化
Outline of Annual Research Achievements	本年度の主な研究成果は以下の研究1～7のようにまとめられる．研究1では，非連結なUV 関数を考慮した進化計算手法を提案した．ベンチマーク関数および実問題への適用を通じて，有力な既存手法であるCPIEおよびNMMSOよりも優れた探索性能を示すことを確認した．研究2では，多目的ブラックボックス関数最適化のための転移学習に基づくマルチスタートスカラー化自然進化戦略を提案した．提案手法は，ベンチマーク問題および実問題である複数車種の同時最適化問題において，通常のマルチスタートスカラー化自然進化戦略よりも優れた探索性能を示すことを確認した．研究3では，月着陸ミッションの最適着陸地点の選定問題のための自然進化戦略を提案した．提案手法は進化計算コンペティション2018単目的最適化部門で優勝した．研究4では，吊り下げ型輸送ドローン制御のための人のスキルを用いた自然進化戦略に基づく転移学習手法を提案し，少ない教師データからロバスト性の高い制御則を効率よく獲得できることを示した．研究5では，微分方程式系推定のための分布学習アルゴリズムの提案を提案した．3つのベンチマーク問題への適用を通じて，提案手法は有力な既存手法である遺伝的プログラミングよりも効率よく式を発見できることを示した．研究6では，逐次状態推定問題における未知パラメータの推定のため，粒子の多様性を交叉により導入する粒子フィルタを提案した．ベンチマーク問題への適用を通じて，提案手法が既存手法よりも高い推定精度を得られることを示した．研究7では，連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法を提案した．多峰性景観環境のベンチマーク問題において，最も有力な既存手法として知られるProximal Policy Optimization (PPO)よりも安定して優れた政策を得られることを確認した．
Current Status of Research Progress	Current Status of Research Progress 1: Research has progressed more than it was originally planned. Reason 今年度は，昨年度に提案した大域的多峰性関数最適化のための自然進化戦略に基づく進化計算手法では解決が困難である非連結なUV 関数を考慮した新たな進化計算手法を提案し，ベンチマーク関数および実問題において既存手法よりも優れた探索性能を示すことを確認できた．また，昨年度に提案した高次元問題のための自然進化戦略のロバスト性を高めた手法を提案し，月着陸ミッションの最適着陸地点の選定問題を対象とした進化計算コンペティション2018単目的部門にて他手法を凌駕する性能を示すことができた．さらに，昨年度に提案した複数車種の構造設計の多目的同時最適化問題のための転移学習に基づくマルチスタート自然進化戦略を改良した手法を提案し，複数車種の構造設計だけでなく，ベンチマーク問題でもその有効性を確認できた．以上より，当初の目的を達成できたと考えている．さらにこれに加えて，吊り下げ型輸送ドローン制御のための人のスキルを用いた自然進化戦略に基づく転移学習手法，微分方程式系推定のための分布学習アルゴリズム，未知パラメータの推定における粒子の多様性を考慮した粒子フィルタ，連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法を提案し，数値実験によりそれぞれで既存手法を凌駕する性能を確認できた．特に，微分方程式系推定のための分布学習アルゴリズムに関する研究は，計測自動制御学会システム・情報部門学術講演会2018(SSI2018)においてSSI最優秀論文賞を受賞した．以上より，当初の計画以上に進展していると判断した．
Strategy for Future Research Activity	平成31年度は，平成30年度に提案した非連結なUV 関数を考慮した新たな進化計算手法を，多目的最適化へ拡張する研究を行う予定である．また，平成30年度に提案した月着陸ミッションの最適着陸地点の選定問題のための自然進化戦略について，より高次元の問題への適用を目指して，さらなる探索の効率化を行う予定である．また，これまでの研究成果をまとめて，学術論文に投稿を行う予定である．
Causes of Carryover	[理由] 学術論文の投稿が間に合わなかったため． [使用計画] 学術論文の掲載料および別刷り料に充てる予定である．

Research Products
(7 results)

All 2019 2018

All Presentation (7 results) (of which Invited: 1 results)

[Presentation] 吊り下げ型輸送ドローン制御のための人のスキルを用いた転移学習2019
- Author(s)
  堀越満, 小野功
- Organizer
  第15回進化計算学会研究会
- Invited
[Presentation] 未知パラメータの推定における粒子の多様性を考慮した粒子フィルタの提案2019
- Author(s)
  小林彦槻，小野功
- Organizer
  第15回進化計算学会研究会
[Presentation] 非明示制約付き大域的多峰性ブラックボックス関数最適化のための進化計算手法2019
- Author(s)
  青木勇輔，小野功
- Organizer
  第61回システム工学部会研究会
[Presentation] 連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法2019
- Author(s)
  秋山朋也，青木勇輔，小野功
- Organizer
  第61回システム工学部会研究会
[Presentation] 微分方程式系推定のための分布学習アルゴリズムの提案2018
- Author(s)
  御田峻平，小野功
- Organizer
  計測自動制御学会システム・情報部門学術講演会2018(SSI2018)
[Presentation] 多目的ブラックボックス関数最適化のための転移学習に基づくマルチスタートスカラー化自然進化戦略2018
- Author(s)
  田中悠毅，青木勇輔，山田大輝，小野功
- Organizer
  計測自動制御学会システム・情報部門学術講演会2018(SSI2018)
[Presentation] 進化計算と強化学習による物理エンジンを用いたロボットの行動学習2018
- Author(s)
  小野功
- Organizer
  物理エンジンサミット2018

2018 Fiscal Year Research-status Report

未知解探索のための大規模最適化基盤の構築

Principal Investigator

小野 功 東京工業大学, 情報理工学院, 准教授 (00304551)

Current Status of Research Progress

Reason

Research Products

[Presentation] 吊り下げ型輸送ドローン制御のための人のスキルを用いた転移学習2019

Author(s)

Organizer

[Presentation] 未知パラメータの推定における粒子の多様性を考慮した粒子フィルタの提案2019

Author(s)

Organizer

[Presentation] 非明示制約付き大域的多峰性ブラックボックス関数最適化のための進化計算手法2019

Author(s)

Organizer

[Presentation] 連続状態・連続行動タスクのためのGaussian policyに基づく政策最適化法2019

Author(s)

Organizer

[Presentation] 微分方程式系推定のための分布学習アルゴリズムの提案2018

Author(s)

Organizer

[Presentation] 多目的ブラックボックス関数最適化のための転移学習に基づくマルチスタートスカラー化自然進化戦略2018

Author(s)

Organizer

[Presentation] 進化計算と強化学習による物理エンジンを用いたロボットの行動学習2018

Author(s)

Organizer

小野功東京工業大学, 情報理工学院, 准教授 (00304551)