2019 Fiscal Year Annual Research Report

From "Exploration" To "Thinking" - Development of Chaos Dynamics through Reinforcement Learning

Research Project

Project/Area Number	15K00360
Research Institution	Oita University
Principal Investigator	柴田克成大分大学, 理工学部, 教授 (10260522)
Project Period (FY)	2015-04-01 – 2020-03-31
Keywords	ニューラルネット / カオスダイナミクス / 感度 / 感度調整学習 / リアプノフ指数 / 勾配消失問題 / 深層学習 / 強化学習
Outline of Annual Research Achievements	本研究で使用するリカレントネットにおいて，カオスダイナミクスの発生および学習によるカオス性低下を防ぐ目的で，前年度，各ニューロンにおいて，入力の微小変化と出力の微小変化の大きさの比である「感度」に注目し，ネットワークのカオス性を生成，維持する学習を提案した。最終年度の本年度は，この「感度」を入力ベクトルによる出力の勾配ベクトルの大きさと再定義し，この値を１もしくはそれより少し大きな値にするような重み値の更新を「感度調整学習」と名付け，これを中心に，以下の３つの方向に大きく展開した。その結果，当初は意図していなかった勾配消失問題の解決と今後への新たな展望を得る大きな成果を得た。【１. 「感度」とネットワークのカオス性の関係】　フラットなリカレントネットにおいて，感度調整学習時の全ニューロンの対数平均感度と最大リアプノフ指数が，ニューロン数や結合割合によらずに１になるまでの間ほぼ一致することを示した。また，２層構造にした場合は，両層の対数平均感度の和が最大リアプノフ指数とほぼ一致することを示した。このことから個々のニューロンでの局所指標を調整して，ネットワーク全体のダイナミクスをコントロールできる可能性を示した。【２. 勾配消失問題の解決】　誤差逆伝播型の学習時に，感度調整学習を併用することで，多層または長期のタイムラグがあるリカレントネットの学習における勾配消失問題を解消できることを示した。【３. 新しい強化学習への手がかり】　本研究の目的は，カオスニューラルネットを用いた強化学習のアルゴリズムを確立することであったが，この感度をTD誤差によって調整する全く新しい強化学習法の着想に至った。これは，ダイナミクス自体を学習するものであり，本研究の最大の問題点であるリカレント部の学習ができないという問題を根本的に解決できる非常に大きな可能性を持った発見であると考えている。

Research Products
(10 results)

All 2019

All Journal Article (6 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

[Journal Article] Learning Time Constant of Continuous-Time Neurons with Gradient Descent2019
- Author(s)
  Matsuki Toshitaka, Shibata Katsunari
- Journal Title
  
  In: P. P. Abdul Majeed A., Mat-Jizat J., Hassan M., Taha Z., Choi H., Kim J. (eds) RITA 2018. Lecture Notes in Mechanical Engineering. Springer
  
  Volume: - Pages: 149～159
- DOI
  https://doi.org/10.1007/978-981-13-8323-6_13
- Peer Reviewed
[Journal Article] Chaos-Based Reinforcement Learning When Introducing Refractoriness in Each Neuron2019
- Author(s)
  Katsuki Sato and Katsunari Shibata
- Journal Title
  
  In: Kim JH., Myung H., Lee SM. (eds) Robot Intelligence Technology and Applications. RiTA 2018. Communications in Computer and Information Science
  
  Volume: 1015 Pages: -
- DOI
  https://doi.org/10.1007/978-981-13-7780-8_7
- Peer Reviewed
[Journal Article] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019
- Author(s)
  徳丸侑輝, 柴田克成
- Journal Title
  
  第38回計測自動制御学会九州支部学術講演会予稿集
  
  Volume: - Pages: 75-78
[Journal Article] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019
- Author(s)
  吉岡晴海, 松木俊貴, 柴田克成
- Journal Title
  
  第38回計測自動制御学会九州支部学術講演会予稿集
  
  Volume: - Pages: 79-82
[Journal Article] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019
- Author(s)
  大石将人, 柴田克成
- Journal Title
  
  第38回計測自動制御学会九州支部学術講演会予稿集
  
  Volume: - Pages: 83-86
[Journal Article] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019
- Author(s)
  長谷部圭亮, 柴田克成
- Journal Title
  
  第38回計測自動制御学会九州支部学術講演会予稿集
  
  Volume: - Pages: 87-90
[Presentation] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019
- Author(s)
  徳丸侑輝, 柴田克成
- Organizer
  第38回計測自動制御学会九州支部学術講演会
[Presentation] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019
- Author(s)
  吉岡晴海, 松木俊貴, 柴田克成
- Organizer
  第38回計測自動制御学会九州支部学術講演会
[Presentation] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019
- Author(s)
  大石将人, 柴田克成
- Organizer
  第38回計測自動制御学会九州支部学術講演会
[Presentation] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019
- Author(s)
  長谷部圭亮, 柴田克成
- Organizer
  第38回計測自動制御学会九州支部学術講演会

2019 Fiscal Year Annual Research Report

From "Exploration" To "Thinking" - Development of Chaos Dynamics through Reinforcement Learning

Principal Investigator

柴田 克成 大分大学, 理工学部, 教授 (10260522)

Research Products

[Journal Article] Learning Time Constant of Continuous-Time Neurons with Gradient Descent2019

Author(s)

Journal Title

DOI

[Journal Article] Chaos-Based Reinforcement Learning When Introducing Refractoriness in Each Neuron2019

Author(s)

Journal Title

DOI

[Journal Article] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019

Author(s)

Journal Title

[Journal Article] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019

Author(s)

Journal Title

[Journal Article] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019

Author(s)

Journal Title

[Journal Article] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019

Author(s)

Journal Title

[Presentation] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019

Author(s)

Organizer

[Presentation] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019

Author(s)

Organizer

[Presentation] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019

Author(s)

Organizer

[Presentation] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019

Author(s)

Organizer

柴田克成大分大学, 理工学部, 教授 (10260522)