• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

ニューラルネットを用いた強化学習で,どこまで高次機能の創発が説明できるかへの挑戦

Research Project

Project/Area Number 19300070
Research InstitutionOita University

Principal Investigator

柴田 克成  Oita University, 工学部, 准教授 (10260522)

Keywords強化学習 / リカレントニューラルネット / 高次機能創発 / 予測 / 記憶 / 意味付け / 自律学習 / 合目的性
Research Abstract

メインで行う予定であったカメラ付き移動ロボットは、修理から戻って来たものの、再び不具合が生じ、実験ができなかった。そこで、急遽可動カメラを用いた実験に切り替え、学習によるシンボル・論理的思考の創発の一環として、パターンからの意味抽出の学習実験を行った。カメラに複数の矢印の画像を見せ、その画像をリカレントニューラルネットに入力して、矢印の方向にカメラを動かすと目標物が見えて報酬がもらえるという設定で強化学習を行った。学習後、ニューラルネット内部に、矢印の形によらずに向きを記憶するニューロンが創発し、かつ、矢印も目標物も見えない状態でもその情報を記憶することができるようになることが確認された。これによって、画像からその意味するところを抽出し、記憶できることがわかった。しかし、簡単な学習であるにもかかわらず、学習できなかったり、時間がかかることと、他の矢印への汎化能力に欠けるという問題点があり、今後この問題を解決して行く必要がある。
さらに、「予測の機能創発」に注目し、可変方向、可変速度で動き、壁に当たると跳ね返る物体をキャッチするタスクにおいて、途中から物体が視野から消えることがある設定で、キャッチしたときの報酬と、失敗したときの罰から学習を行った。この学習だけで、報酬や罰を与えて学習するだけで、物体をキャッチするタイミングと位置を予測できるようになった。さらに、リカレントニューラルネット内部で、物体が消える可能性がある場所の直前で、ある領域の滞在時間から速度を検出し、それを中間層ニューロン間でリレーすることでキャッチするタイミングを計るというメカニズムで予測に貢献していることを確認した。現在予測の機能が自律学習の観点から注目されているが、通常は教師あり学習で学習される。しかし、実世界において、無数の信号から何を予測させるのかという大きな問題点を解決するものとして期待される。

  • Research Products

    (8 results)

All 2010 2009

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (3 results) Book (1 results)

  • [Journal Article] Learning of Action Generation from Raw Camera Images in a Real-World-like Environment by Simple Coupling of Reinforcement Learning and a Neural Network2009

    • Author(s)
      Katsunari Shibata, Tomohiko Kawano
    • Journal Title

      Advances in Neuro-Information Processing, Lecture Notes in Computer Science 5506

      Pages: 755-762

    • Peer Reviewed
  • [Journal Article] Improvement of Practical Recurrent Learning Method and Application to a Pattern Classification Task2009

    • Author(s)
      Mohamad Faizal Bin Samsudin, Katsunari Shibata
    • Journal Title

      Advances in Neuro-Information Processing, Lecture Notes in Computer Science 5507

      Pages: 631-638

    • Peer Reviewed
  • [Journal Article] Contextual Behavior and Internal Representations Acquired by Reinforcement Learning with a Recurrent Neural Network in a Continuous State and Action Space Task2009

    • Author(s)
      Hioroki Utsumomiya, Katsunari Shibata
    • Journal Title

      Advances in Neuro-Information Processing, Lecture Notes in Computer Science 5507

      Pages: 970-978

    • Peer Reviewed
  • [Journal Article] Effect of number of hidden neurons on learning in large-scale layered neural networks2009

    • Author(s)
      Katsunari Shibata, Yusuke Ikeda
    • Journal Title

      Proc.of ICCAS-SICE(ICROS-SICE Int'l Joint Conf.)2009

      Pages: 5008-5013

    • Peer Reviewed
  • [Presentation] リカレントニューラルネットを用いた強化学習による予測機能の創発2009

    • Author(s)
      後藤健太, 松本康生, 柴田克成
    • Organizer
      SICE九州支部学術講演会
    • Year and Date
      20090000
  • [Presentation] ニューラルネットを用いた強化学習による空間情報の抽象化と知識継承2009

    • Author(s)
      柴田克成
    • Organizer
      SICE九州支部学術講演会
    • Place of Presentation
      九州大学伊都キャンパス
    • Year and Date
      2009-11-29
  • [Presentation] ニューラルネットと強化学習を用いた音声によるコミュニケーションの自律学習2009

    • Author(s)
      笹原冬月, 柴田克成
    • Organizer
      SICE九州支部学術講演会
    • Place of Presentation
      九州大学伊都キャンパス
    • Year and Date
      2009-11-29
  • [Book] 「ロボット情報学ハンドブック」(第7.5節 ニューラルネットワークのみ)2010

    • Author(s)
      柴田克成
    • Total Pages
      13
    • Publisher
      ナノオプトニクスエナジー

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi