• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

ニューラルネットを用いた強化学習で,どこまで高次機能の創発が説明できるかへの挑戦

Research Project

Project/Area Number 19300070
Research InstitutionOita University

Principal Investigator

柴田 克成  Oita University, 工学部, 准教授 (10260522)

Keywords強化学習 / リカレントニューラルネット / 高次機能創発 / 離散状態遷移 / 乗算ニューロン / 決定論的知的探索 / 空間的抽象化 / 時間的抽象化
Research Abstract

本研究では、論理的思考の学習による獲得の前段階として、複数離散状態遷移の学習による獲得を目指しているが、本年度は、リカレントニューラルネットに乗算ニューロンを導入することによる効果を調べた。典型的で簡単な複数の離散状態遷移を必要とするタスクである「カウンタータスク」を学習させて、導入前にはほとんど学習できなかったものが、30%の学習成功率となった。しかしながら、単純なカウンタータスクで30%程度の成功率では十分とは言えない。引き続き、学習性能向上を追究して行きたい。
また、メインで行う予定であったカメラ付き車輪移動型ロボットによる実験は、購入したロボットの不具合が多発し、それの対応に追われ、可動カメラの基礎的な学習実験以外は、残念ながら、ほとんど進展がなかった。このロボットは現在も修理中である。
さらに、強化学習とニューラルネットを組み合わせたモデルではできるが、他の手法では実現が困難な高度な空間情報の抽象化の学習能力を人間が有するかどうかを,被験者を用いた心理物理実験によって検証することを試みた。人間はすでに高度な抽象化能力を持っており、この影響を排除して0からの学習の様子を観察するようなタスク設定を行ったつもりであった。しかし、人間の既得の抽象化能力は予想以上に大きく、その影響を十分に排除できず、0からの学習の様子を観察することができなかった。今後もタスクを改良して、引き続き、観察して行く予定である。
最後に、決定論的探索の学習については、連続空間でも、リカレントニューラルネットを用いて、効率的探索方法の学習がある程度できることを示すことができた。しかしながら、連続的に変化する単純なダイナミクスしか生成することができなかった。これは、リカレントニューラルネット自身が複雑なダイナミクスを学習、生成できないという問題であると考えている。

  • Research Products

    (8 results)

All 2008 Other

All Journal Article (4 results) (of which Peer Reviewed: 2 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] Practical Recurrent Learning (PRL)in the Discrete Time Domain2008

    • Author(s)
      Mohamad Faizal Bin Samsudin, Takeshi. Hirose, Katsunari. Shibata
    • Journal Title

      Neural Information Processing of Lecture Notes in Computer Science, (Proc. of Intl Conf. on Neural Information Processing System) Vol. 4984

      Pages: 228-237

    • Peer Reviewed
  • [Journal Article] Acquisition of Flexible Image Recognition by Coupling of Reinforcement Leaming and a Neural Network2008

    • Author(s)
      Katsunari Shibata, Tomohiko Kawano
    • Journal Title

      SICE Journal of Control, Measurement, and System Integration (JCMSI) Vol. 2, No. 2

      Pages: 122-129

    • Peer Reviewed
  • [Journal Article] 強化学習により対象物検出行動を学習した画像入力ニューラルネットにおける中間層ニューロンの解析2008

    • Author(s)
      柴田克成, 河野友彦
    • Journal Title

      第18回インテリジェント・システム・シンポジウム(FAN2008)講演予稿集

      Pages: 145-150

  • [Journal Article] リカレントネットを用いた強化学習による記憶を利用した探索行動の学習2008

    • Author(s)
      後藤健太, 柴田克成
    • Journal Title

      第61回電気関係学会九州支部連合大会講演論文集 (CD-ROM)

  • [Presentation] Improvement of Practical Recurrent Learning Method and Application into a Patt em Classification Task2008

    • Author(s)
      Mohamad Faizal Samsudin, Katsunari Shibata
    • Organizer
      Int'l Conf. on Neural Information Processing System (ICONIP)08
    • Place of Presentation
      Auckland, New Zealand
    • Year and Date
      2008-11-27
  • [Presentation] Contextual Behaviors and Internal Representations Acquired by Reinforcement Leaming with a Recurrent Neural Network in a Continuous State and Action Space Task2008

    • Author(s)
      Hiroki, Utsunomiya, Katsunari Shibata
    • Organizer
      Int'l Conf. 0n Neural Information Processing System (ICONIP)08
    • Place of Presentation
      Auckland, New Zealand
    • Year and Date
      2008-11-27
  • [Presentation] Learning of Action Generation from Raw Camera Images in a Real-World-like Environment by Simple Coupling of Reinforcement Learning and a Neural Network2008

    • Author(s)
      Katsunari Shibata, Tomohiko Kawano
    • Organizer
      Int'l Conf. on Neural Information Processing System (ICONIP)08
    • Place of Presentation
      Auckland, New Zealand
    • Year and Date
      2008-11-26
  • [Remarks] 解説記事:柴田克成、強化学習とニューラルネットによる知能創発,計測と制御, Vol. 48, No. 1, pp. 106--111, 2009.1 webページ

    • URL

      http://shws.cc.oita-u.ac.jp/~shibata/home-j.html

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi