2022 年度実績報告書

完全オンライン型強化学習システムにおける時間と空間の分節化

研究課題

研究課題/領域番号	18K11473
研究機関	大阪公立大学
研究代表者	野津亮大阪公立大学, 大学院現代システム科学研究科, 教授 (40405345)
研究分担者	生方誠希大阪公立大学, 大学院情報学研究科, 准教授 (10755698) 本多克宏大阪公立大学, 大学院情報学研究科, 教授 (80332964)
研究期間 (年度)	2018-04-01 – 2023-03-31
キーワード	強化学習 / 進化計算 / ニューラルネットワーク / 最適化アルゴリズム / バンディットアルゴリズム
研究実績の概要	最終年度では，複数の深層強化学習ネットワークを並列的に学習させ，最適な特徴量を抽出しやすいニューラルネットワークを生成する手法を開発，検討した．複数のネットワークに経験を共有させることによって探索的な行動政策がそれほど必要なくなること，計算コストを抑えるために経験共有をしない場合は，行動を決定するネットワークの選択をするバンディットアルゴリズムに結果が大きく依存することなどが新しい知見として得られた．また，良い分節化を得られるネットワークを得るための，進化計算アルゴリズムの開発においてはアルゴリズムの簡略化に成功し，より直感的でわかりやすいパラメータの設定によって探索効率を上げることに成功した．具体的には適応的差分進化JADE手法に領域外探索を加えるのだが，その距離を自動的に決めて，パラメータとしては，領域外探索をする時の探索成功率というシンプルなもののみに絞ることができた．研究期間全体を通じて，空間・時間の分節化，適切な強化学習の選択についてアルゴリズムを開発し，研究発表することができた．また，派生的な研究として，これらを適応的に進化させるための進化計算アルゴリズムを大きな突然変異を組み込んだ形で研究発表できた．当初，本研究課題計画からの変更点としては，深層強化学習を扱うことにした点が大きい．研究計画を立てた段階では成長型自己組織化マップの多層化を検討していたが，近年のAI技術の発展に伴い，ディープラーニングが注目され，それらとの明確な区別がつけづらくなった．加えて，必要とするメモリ量を減らすことにそれほど大きな意味も無くなってきたということで，シフトしたが，漸近最適戦略や最適化を深層強化学習に適用し成果を上げることができたのは非常に大きい学術的な意義があったと考えている．

研究成果
(4件)

すべて 2023 2022

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件)

[雑誌論文] Addition of Out-of-Population Search in JADE2023
- 著者名/発表者名
  MIYAHIRA Yuichi、IGUCHI Makishi、NOTSU Akira、HONDA Katsuhiro
- 雑誌名
  
  Journal of Japan Society for Fuzzy Theory and Intelligent Informatics
  
  巻: 35 ページ: 532～537
- DOI
  10.3156/jsoft.35.1_532
- 査読あり
[雑誌論文] Deep Reinforcement Learning Combined with Approximation of Number of State Experiences2022
- 著者名/発表者名
  M. Iguchi, A. Notsu, K. Yasunaga, S. Ubukata, K. Honda
- 雑誌名
  
  Proc. of 2022 International Conference on Fuzzy Theory and Its Applications
  
  巻: 1 ページ: #0012 6pages
- 査読あり
[雑誌論文] Addition of Out-of-population Search Based on the Rate of Solution Updates in JADE2022
- 著者名/発表者名
  Y. Miyahira, A. Notsu, K. Honda
- 雑誌名
  
  Proc. of 2022 International Conference on Fuzzy Theory and Its Applications
  
  巻: 1 ページ: #0077 6Pages
- 査読あり
[学会発表] JADEにおける解の更新割合に基づいた集団外探索の追加2022
- 著者名/発表者名
  宮平裕一, 野津亮, 本多克宏
- 学会等名
  日本知能情報ファジィ学会

2022 年度 実績報告書

完全オンライン型強化学習システムにおける時間と空間の分節化

研究代表者

野津 亮 大阪公立大学, 大学院現代システム科学研究科, 教授 (40405345)

研究成果

[雑誌論文] Addition of Out-of-Population Search in JADE2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Deep Reinforcement Learning Combined with Approximation of Number of State Experiences2022

著者名/発表者名

雑誌名

[雑誌論文] Addition of Out-of-population Search Based on the Rate of Solution Updates in JADE2022

著者名/発表者名

雑誌名

[学会発表] JADEにおける解の更新割合に基づいた集団外探索の追加2022

著者名/発表者名

学会等名

2022 年度実績報告書

野津亮大阪公立大学, 大学院現代システム科学研究科, 教授 (40405345)