• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

ニューラルネットを用いた強化学習で,どこまで高次機能の創発が説明できるかへの挑戦

Research Project

Project/Area Number 19300070
Research InstitutionOita University

Principal Investigator

柴田 克成  Oita University, 工学部, 准教授 (10260522)

Keywords強化学習 / リカレントニューラルネット / 高次機能創発 / 離散状態遷移 / 乗算ニューロン / 決定論的知的探索 / 空間的抽象化 / 時間的抽象化
Research Abstract

本年度はまず,リカレントニューラルネットへの乗算ニューロンの導入により,従来困難だった離散状態間遷移の学習を目指した。その際,出力ニューロンをフィードバックする構造の導入によって,離散状態遷移の学習が大きく改善されそうであることを発見した。そして,簡単な数を数えるという問題において,出力ニューロンのフィードバックの導入で学習性能が大幅に向上することを示した。
さらに,強化学習を行なう際に,従来のような階層型ではなく,リカレント型のニューラルネットを導入することにより,シミュレーションでの移動ロボットのゴール到達タスクにおいて,ゴール到達前にスイッチを踏んで,そのスイッチの種類によって2つのゴールのうちのどちらかに向かうことを求めると,スイッチを踏んでから正しいゴールに向かう行動が学習できることがわかった。また,その際に,隠れ層の中に,踏んだスイッチの種類を記憶しているニューロンが発見され,さらに,ゴールに到達しても報酬を与えないで試行を続けると,スイッチを踏みに戻るという非常に興味深い行動が観察された。また,強化学習においてニューラルネットを使うことの有用性を現実レベルの問題で確かめるために,視覚センサを搭載した四足歩行ロボットを用いて,相手のロボットに近づいて行ってキスをするというタスクの学習をさせた。そして,タスクの情報も,画像認識の方法も一切与えることなく,照明条件や背景,ロボットの向きなどによらず,実世界に近い環境において,80から90%程度の割合でタスクを成功させることができた。
強化学習による決定論的知的探索の学習の研究においては,エージェントが過去の記憶を利用した探索を学習できることを示し,かつ,探索を通して環境の情報をある程度把握できることを示した。しかしながら,以前記憶したことを忘れてしまう傾向にあることがわかった。これを解決して行くことは今後の課題である。

  • Research Products

    (5 results)

All 2007 Other

All Journal Article (4 results) (of which Peer Reviewed: 1 results) Remarks (1 results)

  • [Journal Article] Practical Recurrent Learning (PRL) in the Discrete Time Domain2007

    • Author(s)
      Mohamad Faizal Bin Samsudin, Takeshi. Hirose, Katsunari. Shibata
    • Journal Title

      Proc. of Int'l Conf. on Neural Information Processing System (CD-ROM)

    • Peer Reviewed
  • [Journal Article] 画像入カニューラルネットを用いた強化学習による可動カメラの対象物検出行動2007

    • Author(s)
      河野友彦, 幸和芳, 柴田克成
    • Journal Title

      第26回計測自動制御学会九州支部学術講演会予稿集

      Pages: 155-158

  • [Journal Article] リカレント型ニューラルネットの実用的な学習則である離散時間PRL学習法2007

    • Author(s)
      Mohamad Faizal Bin Samsudin, 廣瀬武志, 柴田克成
    • Journal Title

      第26回計測自動制御学会九州支部学術講演会予稿集

      Pages: 57-60

  • [Journal Article] 複数の隠れニューロンの生成が可能な成長型ニューラルネットの構築2007

    • Author(s)
      由崎高志, 柴田克成
    • Journal Title

      第26回計測自動制御学会九州支部学術講演会予稿集

      Pages: 53-56

  • [Remarks]

    • URL

      http://shws.cc.oita-u.ac.jp/~shibata/home-j.html

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi