• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Establishment of Chaos-based Dynamic Reinforcement Learning as Taking an Essential Technology to Realize Emergence of Thinking in Advance

Research Project

Project/Area Number 20K11993
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 61040:Soft computing-related
Research InstitutionOita University

Principal Investigator

柴田 克成  大分大学, 理工学部, 教授 (10260522)

Project Period (FY) 2020-04-01 – 2021-03-31
Project Status Discontinued (Fiscal Year 2020)
Budget Amount *help
¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2020: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Keywordsダイナミック強化学習 / 感度 / 感度調整学習(SAL) / エッジオブカオス / カオス性 / カオスニューラルネット / 思考創発 / 多段階状態遷移
Outline of Research at the Start

本研究では,申請者が考案した,評価値の変化に基づいてニューラルネットのカオス性,つまり,ダイナミクスの収束,発散を調整する全く新しい強化学習「ダイナミック強化学習」に対し,学習タスクを段階的に,(1)静的なタスクから(2)記憶が必要なタスク,(3)外部の状態変化によって内部での状態変化が必要なタスク,(4)内部で時系列的な予測シミュレーションのような自律的な内部状態遷移が必要なタスクへと変化させ,それぞれの段階での問題点の洗い出しと解決法の模索をしていく。そして,「思考」に必要な「自律的かつ合理的な状態遷移ダイナミクス」の学習による獲得に必須となる核心的技術を先取りして確立することを目指す。

Outline of Annual Research Achievements

(本研究は、研究代表者の退職に伴う資格喪失のため、やむを得ず1年で廃止となった。この実績は廃止までの1年分のものである)
本研究は大きく分けて3つの研究を行った。
【1】感度調整学習(SAL)のまとめ 本研究の主題「カオスベースダイナミック強化学習」の基盤となる「感度調整学習(SAS)」について、各ニューロンでの感度調整でネットワーク全体のダイナミクスを調整できることの理論的背景を整理するとともに、カオスダイナミクスの生成および教師あり学習との併用についての系統的なシミュレーションを行い、論文に投稿した。
【2】ダイナミック強化学習の基礎研究 強化学習に基づいて各ニューロンで感度を変化させることで、ネットワークダイナミクスを直接学習させるダイナミック強化学習の枠組みで、簡易視覚センサを用いて、エージェントが簡単な物体到達タスクを学習できることを示した。さらに、物体との距離および角度の情報をセンサ入力とした場合でも、同様に学習できた。また、外部入力に対し、フィードバック入力の学習係数を外部入力より小さくした方が性能は良かった。想定していた学習による感度の減少はみられなかった。また、TD誤差が正の際の出力の維持拘束により、この学習係数の差のために感度が増加する場合があることがわかった。
【3】ダイナミック教師あり学習の基礎検討 ダイナミクスを直接学習させる考え方を教師あり学習にも導入できるかの基礎検討を行なった。入出力に10ステップの時間差のあるEXOR問題の学習を、誤差の時間平均と現在の誤差との差に基づいて感度を変化させた。(出力ニューロンは通常の誤差勾配で学習) そして、出力ニューロンの学習だけではできなかったものが、この学習を導入することで正しい出力が得られるようになった。
感度を通してダイナミクスを直接学習させるという新しい学習の枠組みがある程度動作することが確認できた。

Report

(1 results)
  • 2020 Annual Research Report
  • Research Products

    (15 results)

All 2021 2020

All Journal Article (8 results) (of which Peer Reviewed: 2 results) Presentation (7 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021

    • Author(s)
      江島拓哉, 徳丸侑輝, 柴田克成
    • Journal Title

      電子情報通信学会技術研究報告

      Volume: Vol.120, No. 403 Pages: 151-156

    • Related Report
      2020 Annual Research Report
  • [Journal Article] リカレントネット内の感度調整によって学習を行う強化学習2020

    • Author(s)
      徳丸侑輝, 柴田克成
    • Journal Title

      第39回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 160-163

    • Related Report
      2020 Annual Research Report
  • [Journal Article] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020

    • Author(s)
      江島拓哉, 徳丸侑輝, 柴田克成
    • Journal Title

      第39回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 118-121

    • Related Report
      2020 Annual Research Report
  • [Journal Article] 感度調整学習を用いたリザバネットの構築2020

    • Author(s)
      吉岡晴海, 松木俊貴, 柴田克成
    • Journal Title

      第39回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 122-125

    • Related Report
      2020 Annual Research Report
  • [Journal Article] Adaptive balancing of exploration and exploitation around the edge of chaos in internal-chaos-based learning2020

    • Author(s)
      Toshitaka Matsuki and Katsunari Shibata
    • Journal Title

      Neural Networks

      Volume: 132 Pages: 19-29

    • DOI

      10.1016/j.neunet.2020.08.002

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Q-learning with exploration driven by internal dynamics in chaotic neural network2020

    • Author(s)
      Toshitaka Matsuki and Katsunari Shibata
    • Journal Title

      Proc. of Int'l Joint Conf. on Neural Networks (IJCNN) 2020

      Volume: - Pages: 1-7

    • DOI

      10.1109/ijcnn48605.2020.9207114

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Journal Article] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020

    • Author(s)
      大石将人,松木俊貴, 柴田克成
    • Journal Title

      第39回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 156-159

    • Related Report
      2020 Annual Research Report
  • [Journal Article] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020

    • Author(s)
      黒崎耕平, 柴田克成
    • Journal Title

      第39回計測自動制御学会九州支部学術講演会予稿集

      Volume: - Pages: 126-129

    • Related Report
      2020 Annual Research Report
  • [Presentation] 層構造リカレントネットにおける感度調整学習時の感度と最大リアプノフ指数の関係2021

    • Author(s)
      江島拓哉, 徳丸侑輝, 柴田克成
    • Organizer
      電子情報通信学会 ニューロコンピューティング研究会
    • Related Report
      2020 Annual Research Report
  • [Presentation] リカレントネット内の感度調整によって学習を行う強化学習2020

    • Author(s)
      徳丸侑輝, 柴田克成
    • Organizer
      第39回計測自動制御学会九州支部学術講演会
    • Related Report
      2020 Annual Research Report
  • [Presentation] リカレントネットにおける感度調整学習時の感度とリアプノフ指数の関係2020

    • Author(s)
      江島拓哉, 徳丸侑輝, 柴田克成
    • Organizer
      第39回計測自動制御学会九州支部学術講演会
    • Related Report
      2020 Annual Research Report
  • [Presentation] 感度調整学習を用いたリザバネットの構築2020

    • Author(s)
      吉岡晴海, 松木俊貴, 柴田克成
    • Organizer
      第39回計測自動制御学会九州支部学術講演会
    • Related Report
      2020 Annual Research Report
  • [Presentation] Q-learning with exploration driven by internal dynamics in chaotic neural network2020

    • Author(s)
      Toshitaka Matsuki and Katsunari Shibata
    • Organizer
      Int'l Joint Conf. on Neural Networks (IJCNN) 2020
    • Related Report
      2020 Annual Research Report
    • Int'l Joint Research
  • [Presentation] リカレントネットによる状態遷移タスクの教師あり学習におけるカオス性の影響2020

    • Author(s)
      大石将人,松木俊貴, 柴田克成
    • Organizer
      第39回計測自動制御学会九州支部学術講演会
    • Related Report
      2020 Annual Research Report
  • [Presentation] カオスニューラルネットを用いた記憶問題の学習における不応性導入の影響2020

    • Author(s)
      黒崎耕平, 柴田克成
    • Organizer
      第39回計測自動制御学会九州支部学術講演会
    • Related Report
      2020 Annual Research Report

URL: 

Published: 2020-04-28   Modified: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi