• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

From "Exploration" To "Thinking" - Development of Chaos Dynamics through Reinforcement Learning

Research Project

Project/Area Number 15K00360
Research InstitutionOita University

Principal Investigator

柴田 克成  大分大学, 理工学部, 教授 (10260522)

Project Period (FY) 2015-04-01 – 2020-03-31
Keywordsニューラルネット / カオスダイナミクス / 感度 / 感度調整学習 / リアプノフ指数 / 勾配消失問題 / 深層学習 / 強化学習
Outline of Annual Research Achievements

本研究で使用するリカレントネットにおいて,カオスダイナミクスの発生および学習によるカオス性低下を防ぐ目的で,前年度,各ニューロンにおいて,入力の微小変化と出力の微小変化の大きさの比である「感度」に注目し,ネットワークのカオス性を生成,維持する学習を提案した。最終年度の本年度は,この「感度」を入力ベクトルによる出力の勾配ベクトルの大きさと再定義し,この値を1もしくはそれより少し大きな値にするような重み値の更新を「感度調整学習」と名付け,これを中心に,以下の3つの方向に大きく展開した。その結果,当初は意図していなかった勾配消失問題の解決と今後への新たな展望を得る大きな成果を得た。
【1. 「感度」とネットワークのカオス性の関係】 フラットなリカレントネットにおいて,感度調整学習時の全ニューロンの対数平均感度と最大リアプノフ指数が,ニューロン数や結合割合によらずに1になるまでの間ほぼ一致することを示した。また,2層構造にした場合は,両層の対数平均感度の和が最大リアプノフ指数とほぼ一致することを示した。このことから個々のニューロンでの局所指標を調整して,ネットワーク全体のダイナミクスをコントロールできる可能性を示した。
【2. 勾配消失問題の解決】 誤差逆伝播型の学習時に,感度調整学習を併用することで,多層または長期のタイムラグがあるリカレントネットの学習における勾配消失問題を解消できることを示した。
【3. 新しい強化学習への手がかり】 本研究の目的は,カオスニューラルネットを用いた強化学習のアルゴリズムを確立することであったが,この感度をTD誤差によって調整する全く新しい強化学習法の着想に至った。これは,ダイナミクス自体を学習するものであり,本研究の最大の問題点であるリカレント部の学習ができないという問題を根本的に解決できる非常に大きな可能性を持った発見であると考えている。

  • Research Products

    (10 results)

All 2019

All Journal Article (6 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] Learning Time Constant of Continuous-Time Neurons with Gradient Descent2019

    • Author(s)
      Matsuki Toshitaka, Shibata Katsunari
    • Journal Title

      In: P. P. Abdul Majeed A., Mat-Jizat J., Hassan M., Taha Z., Choi H., Kim J. (eds) RITA 2018. Lecture Notes in Mechanical Engineering. Springer

      Volume: - Pages: 149~159

    • DOI

      https://doi.org/10.1007/978-981-13-8323-6_13

    • Peer Reviewed
  • [Journal Article] Chaos-Based Reinforcement Learning When Introducing Refractoriness in Each Neuron2019

    • Author(s)
      Katsuki Sato and Katsunari Shibata
    • Journal Title

      In: Kim JH., Myung H., Lee SM. (eds) Robot Intelligence Technology and Applications. RiTA 2018. Communications in Computer and Information Science

      Volume: 1015 Pages: -

    • DOI

      https://doi.org/10.1007/978-981-13-7780-8_7

    • Peer Reviewed
  • [Journal Article] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019

    • Author(s)
      徳丸侑輝, 柴田克成
    • Journal Title

      第38回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 75-78

  • [Journal Article] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019

    • Author(s)
      吉岡晴海, 松木俊貴, 柴田克成
    • Journal Title

      第38回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 79-82

  • [Journal Article] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019

    • Author(s)
      大石将人, 柴田克成
    • Journal Title

      第38回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 83-86

  • [Journal Article] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019

    • Author(s)
      長谷部圭亮, 柴田克成
    • Journal Title

      第38回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 87-90

  • [Presentation] リカレントネットにおける感度調整学習でのカオスダイナミクスの生成と維持2019

    • Author(s)
      徳丸侑輝, 柴田克成
    • Organizer
      第38回計測自動制御学会九州支部学術講演会
  • [Presentation] 多層リードアウトを持つリザバを用いた強化学習におけるネットワーク構造の検討2019

    • Author(s)
      吉岡晴海, 松木俊貴, 柴田克成
    • Organizer
      第38回計測自動制御学会九州支部学術講演会
  • [Presentation] カオスニューラルネットを用いた記憶タスクの強化学習におけるカオス性の影響2019

    • Author(s)
      大石将人, 柴田克成
    • Organizer
      第38回計測自動制御学会九州支部学術講演会
  • [Presentation] 多層ニューラルネットにおける勾配消失問題解決法としての感度調整学習2019

    • Author(s)
      長谷部圭亮, 柴田克成
    • Organizer
      第38回計測自動制御学会九州支部学術講演会

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi