• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

強化学習によるロボットの諸機能の自律的・調和的・合目的的獲得と知能形成

研究課題

研究課題/領域番号 15300064
研究機関大分大学

研究代表者

柴田 克成  大分大学, 工学部, 助教授 (10260522)

キーワード強化学習 / ニューラルネット / 知能形成 / コミュニケーション / シンボル / ロボット / リカレントニューラルネット / 報酬期待ニューロン
研究概要

【1】会話の学習におけるシンボルの発現
リカレントニューラルネットを用い、単に強化学習によってコミュニケーションを必要とするタスクの学習を行うだけで、ノイズを付加すると学習によって獲得されたコミュニケーション信号が時系列のものでも離散化し、ノイズに強いコミュニケーションが実現できることを示した。さらに、2エージェント間コミュニケーションの学習において、送信側エージェントの出力に微小な確率的要素を付加し、受信側エージェントは確率的要素を排除したグリーディな行動選択をすると学習成功率が向上することを示した。
【2】疑似実環境下での物体到達タスクの強化学習
今まで用いていた白い壁、白い床を取り除き、まわりに目標物以外の物体やカラフルな広告を置くことで疑似実環境を実現し、カラーの視覚センサ信号をそのままニューラルネットに入力して、ロボットに3種類の色をつけた目標物への到達タスクの学習を行わせた。そして、目標物への到達を学習できることを示した。ただし、目標物と同じ色を含む物体を並べて置くと、必ずしも目標物に到達できないという問題点が残った。
【3】成長型ニューラルネットによる多層構造の形成の研究→研究項目【5】に変更
【4】リカレントニューラルネットの実用的学習アルゴリズムの研究
従来連続時間を前提に定式化していたものを、解析を容易にするため、離散時間を前提とした定式化を行い、簡単な短期記憶を必要とするEXOR問題を解かせ、学習できることを確認した。
【5】報酬期待ニューロンの強化学習による発現モデル
サルに複数回の試行をくり返した後に報酬がもらえるタスクをさせた際に、報酬試行以外で反応する前部帯状皮質のニューロンに着目した。そして、リカレントニューラルネットと強化学習による発現モデルを学習させた結果から、単一試行から複数試行への移行時に、適切な状態評価を実現するために一時的に現れるものである可能性を示した。

  • 研究成果

    (6件)

すべて 2005 2004

すべて 雑誌論文 (6件)

  • [雑誌論文] Discretization of Series of Communication Signals in Noisy Environment by Reinforcement Learning2005

    • 著者名/発表者名
      Katsunari Shibata
    • 雑誌名

      Proc.of the 7th Int'l Conf.in Adaptive and Natural Computing Algorithms

      ページ: 486-489

  • [雑誌論文] Effect of action selection on emergence of one-way communication using Q-learning2005

    • 著者名/発表者名
      Masanobu Nakanishi, Katsunari Shibata
    • 雑誌名

      Proc.of 10^<th> Int'l Symp.On Artificial Life and Robotics (AROB) CD-ROM

      ページ: GS7-3

  • [雑誌論文] A model of emergence of reward expectancy neurons by reinforcement learning2005

    • 著者名/発表者名
      Shinya Ishii, Munetaka Shidara, Katsunari Shibata
    • 雑誌名

      Proc.of 10^<th> Int'l Symp.On Artificial Life and Robotics (AROB) CD-ROM

      ページ: GS21-5

  • [雑誌論文] 視覚センサ付き実ロボットによる箱押し行動の獲得 -強化学習によるセンサーモータ間トータル機能獲得への第一歩-2004

    • 著者名/発表者名
      柴田克成, 飯田大
    • 雑誌名

      第14回インテリジェント・システム・シンポジウム(FAN Symposium)講演論文集

      ページ: 123-128

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Dynamics of a Recurrent Neural Network Acquired through the Learning of a Context based Attention Task2004

    • 著者名/発表者名
      Katsunari Shibata, Masanori Sugisaka
    • 雑誌名

      Artificial Life and Robotics Vol.7

      ページ: 145-150

  • [雑誌論文] 多入力ニューラルネットの学習過程における中間層ニューロン数の影響2004

    • 著者名/発表者名
      幸和芳, 柴田克成
    • 雑誌名

      第23回計測自動制御学会九州支部学術講演会予稿集

      ページ: 369-372

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi