2022 年度研究成果報告書

完全オンライン型強化学習システムにおける時間と空間の分節化

研究課題

PDF

研究課題/領域番号	18K11473
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61040:ソフトコンピューティング関連
研究機関	大阪公立大学 (2022) 大阪府立大学 (2018-2021)
研究代表者	野津亮大阪公立大学, 大学院現代システム科学研究科, 教授 (40405345)
研究分担者	生方誠希大阪公立大学, 大学院情報学研究科, 准教授 (10755698) 本多克宏大阪公立大学, 大学院情報学研究科, 教授 (80332964)
研究期間 (年度)	2018-04-01 – 2023-03-31
キーワード	強化学習 / クラスタリング / 最適化アルゴリズム / 転移学習 / 学習と進化
研究成果の概要	成長型自己組織化マップを強化学習向けに改良し，学習効率を維持しながらも状態空間・状態遷移を教師無し学習で学習する手法を考案し，その有用性を湿すことができた．また，ハイパーパラメータの設定を適応的に大きく変更することでも，環境に適応できることを示した．さらに，最適化アルゴリズム手法の中でも優秀な差分進化に対し，いくつかの局所的環境を推定しながら手法を切り替える方法を提案し，性能を改善することができた．加えて，当初はあまり検討していなかった深層強化学習へ本研究で得られた知見を応用し，全く新しい深層強化学習システムを提案できた．
自由記述の分野	強化学習
研究成果の学術的意義や社会的意義	本研究は強化学習が必要とする空間を統計学的に大量のデータを用いて獲得するのでは無く，幾何学的なミクロな観点から獲得したという意味で学術的な意義があると考えている．また，機械学習にとってハイパーパラメータの設定は大きな問題であるが，その適応的変化や並列学習で対応できることを明らかにしたことは，学術的にも産業応用を考えた上でも意義がある．さらに，ブラックボックス最適化アルゴリズムを発展させることは複雑化する社会問題など，ありとあらゆる最適化に貢献できることを意味しているので，社会的にも大きな意義がある．