思考創発への必須技術を先取りするカオスベースダイナミック強化学習の確立

研究課題

研究課題/領域番号	20K11993
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61040:ソフトコンピューティング関連
研究機関	大分大学
研究代表者	柴田克成大分大学, 理工学部, 教授 (10260522)
研究期間 (年度)	2020-04-01 – 2021-03-31
研究課題ステータス	中途終了 (2020年度)
配分額 *注記	3,770千円 (直接経費: 2,900千円、間接経費: 870千円) 2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円) 2020年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
キーワード	ダイナミック強化学習 / 感度 / 感度調整学習（SAL) / エッジオブカオス / カオス性 / カオスニューラルネット / 思考創発 / 多段階状態遷移
研究開始時の研究の概要	本研究では，申請者が考案した，評価値の変化に基づいてニューラルネットのカオス性，つまり，ダイナミクスの収束，発散を調整する全く新しい強化学習「ダイナミック強化学習」に対し，学習タスクを段階的に，(1)静的なタスクから(2)記憶が必要なタスク，(3)外部の状態変化によって内部での状態変化が必要なタスク，(4)内部で時系列的な予測シミュレーションのような自律的な内部状態遷移が必要なタスクへと変化させ，それぞれの段階での問題点の洗い出しと解決法の模索をしていく。そして，「思考」に必要な「自律的かつ合理的な状態遷移ダイナミクス」の学習による獲得に必須となる核心的技術を先取りして確立することを目指す。
研究実績の概要	（本研究は、研究代表者の退職に伴う資格喪失のため、やむを得ず１年で廃止となった。この実績は廃止までの１年分のものである）本研究は大きく分けて３つの研究を行った。【１】感度調整学習(SAL)のまとめ　本研究の主題「カオスベースダイナミック強化学習」の基盤となる「感度調整学習(SAS)」について、各ニューロンでの感度調整でネットワーク全体のダイナミクスを調整できることの理論的背景を整理するとともに、カオスダイナミクスの生成および教師あり学習との併用についての系統的なシミュレーションを行い、論文に投稿した。【２】ダイナミック強化学習の基礎研究　強化学習に基づいて各ニューロンで感度を変化させることで、ネットワークダイナミクスを直接学習させるダイナミック強化学習の枠組みで、簡易視覚センサを用いて、エージェントが簡単な物体到達タスクを学習できることを示した。さらに、物体との距離および角度の情報をセンサ入力とした場合でも、同様に学習できた。また、外部入力に対し、フィードバック入力の学習係数を外部入力より小さくした方が性能は良かった。想定していた学習による感度の減少はみられなかった。また、TD誤差が正の際の出力の維持拘束により、この学習係数の差のために感度が増加する場合があることがわかった。【３】ダイナミック教師あり学習の基礎検討　ダイナミクスを直接学習させる考え方を教師あり学習にも導入できるかの基礎検討を行なった。入出力に10ステップの時間差のあるEXOR問題の学習を、誤差の時間平均と現在の誤差との差に基づいて感度を変化させた。(出力ニューロンは通常の誤差勾配で学習) そして、出力ニューロンの学習だけではできなかったものが、この学習を導入することで正しい出力が得られるようになった。感度を通してダイナミクスを直接学習させるという新しい学習の枠組みがある程度動作することが確認できた。

報告書

(1件)

2020 実績報告書

研究成果
(15件)

すべて 2021 2020

すべて雑誌論文 (8件) (うち査読あり 2件) 学会発表 (7件) (うち国際学会 1件)

[雑誌論文] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021
- 著者名/発表者名
  江島拓哉, 徳丸侑輝, 柴田克成
- 雑誌名
  
  電子情報通信学会技術研究報告
  
  巻: Vol.120, No. 403 ページ: 151-156
- 関連する報告書
  2020 実績報告書
[雑誌論文] リカレントネット内の感度調整によって学習を行う強化学習2020
- 著者名/発表者名
  徳丸侑輝, 柴田克成
- 雑誌名
  
  第39回計測自動制御学会九州支部学術講演会予稿集
  
  巻: - ページ: 160-163
- 関連する報告書
  2020 実績報告書
[雑誌論文] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020
- 著者名/発表者名
  江島拓哉, 徳丸侑輝, 柴田克成
- 雑誌名
  
  第39回計測自動制御学会九州支部学術講演会予稿集
  
  巻: - ページ: 118-121
- 関連する報告書
  2020 実績報告書
[雑誌論文] 感度調整学習を用いたリザバネットの構築2020
- 著者名/発表者名
  吉岡晴海, 松木俊貴, 柴田克成
- 雑誌名
  
  第39回計測自動制御学会九州支部学術講演会予稿集
  
  巻: - ページ: 122-125
- 関連する報告書
  2020 実績報告書
[雑誌論文] Adaptive balancing of exploration and exploitation around the edge of chaos in internal-chaos-based learning2020
- 著者名/発表者名
  Toshitaka Matsuki and Katsunari Shibata
- 雑誌名
  
  Neural Networks
  
  巻: 132 ページ: 19-29
- DOI
  10.1016/j.neunet.2020.08.002
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Q-learning with exploration driven by internal dynamics in chaotic neural network2020
- 著者名/発表者名
  Toshitaka Matsuki and Katsunari Shibata
- 雑誌名
  
  Proc. of Int'l Joint Conf. on Neural Networks (IJCNN) 2020
  
  巻: - ページ: 1-7
- DOI
  10.1109/ijcnn48605.2020.9207114
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020
- 著者名/発表者名
  大石将人,松木俊貴, 柴田克成
- 雑誌名
  
  第39回計測自動制御学会九州支部学術講演会予稿集
  
  巻: - ページ: 156-159
- 関連する報告書
  2020 実績報告書
[雑誌論文] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020
- 著者名/発表者名
  黒崎耕平, 柴田克成
- 雑誌名
  
  第39回計測自動制御学会九州支部学術講演会予稿集
  
  巻: - ページ: 126-129
- 関連する報告書
  2020 実績報告書
[学会発表] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021
- 著者名/発表者名
  江島拓哉, 徳丸侑輝, 柴田克成
- 学会等名
  電子情報通信学会ニューロコンピューティング研究会
- 関連する報告書
  2020 実績報告書
[学会発表] リカレントネット内の感度調整によって学習を行う強化学習2020
- 著者名/発表者名
  徳丸侑輝, 柴田克成
- 学会等名
  第39回計測自動制御学会九州支部学術講演会
- 関連する報告書
  2020 実績報告書
[学会発表] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020
- 著者名/発表者名
  江島拓哉, 徳丸侑輝, 柴田克成
- 学会等名
  第39回計測自動制御学会九州支部学術講演会
- 関連する報告書
  2020 実績報告書
[学会発表] 感度調整学習を用いたリザバネットの構築2020
- 著者名/発表者名
  吉岡晴海, 松木俊貴, 柴田克成
- 学会等名
  第39回計測自動制御学会九州支部学術講演会
- 関連する報告書
  2020 実績報告書
[学会発表] Q-learning with exploration driven by internal dynamics in chaotic neural network2020
- 著者名/発表者名
  Toshitaka Matsuki and Katsunari Shibata
- 学会等名
  Int'l Joint Conf. on Neural Networks (IJCNN) 2020
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020
- 著者名/発表者名
  大石将人,松木俊貴, 柴田克成
- 学会等名
  第39回計測自動制御学会九州支部学術講演会
- 関連する報告書
  2020 実績報告書
[学会発表] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020
- 著者名/発表者名
  黒崎耕平, 柴田克成
- 学会等名
  第39回計測自動制御学会九州支部学術講演会
- 関連する報告書
  2020 実績報告書

思考創発への必須技術を先取りするカオスベースダイナミック強化学習の確立

研究代表者

柴田 克成 大分大学, 理工学部, 教授 (10260522)

3,770千円 (直接経費: 2,900千円、間接経費: 870千円)

報告書

研究成果

[雑誌論文] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] リカレントネット内の感度調整によって学習を行う強化学習2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 感度調整学習を用いたリザバネットの構築2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Adaptive balancing of exploration and exploitation around the edge of chaos in internal-chaos-based learning2020

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Q-learning with exploration driven by internal dynamics in chaotic neural network2020

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] リカレントネット内の感度調整によって学習を行う強化学習2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] 感度調整学習を用いたリザバネットの構築2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Q-learning with exploration driven by internal dynamics in chaotic neural network2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020

著者名/発表者名

学会等名

関連する報告書

柴田克成大分大学, 理工学部, 教授 (10260522)