• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

実ロボットによるDirect-Vision-Based強化学習の検証

研究課題

研究課題/領域番号 13780295
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関大分大学

研究代表者

柴田 克成  大分大学, 工学部, 助教授 (10260522)

研究期間 (年度) 2001 – 2002
研究課題ステータス 完了 (2002年度)
配分額 *注記
2,400千円 (直接経費: 2,400千円)
2002年度: 900千円 (直接経費: 900千円)
2001年度: 1,500千円 (直接経費: 1,500千円)
キーワード強化学習 / ニューラルネット / 自律学習 / Direct-Vision-Based強化学習 / 移動ロボット / 視覚センサ / 押し動作 / 創発 / 実ロボット / 中間層 / 大域的表現
研究概要

昨年度、リニアの視覚センサ付きの小型移動ロボットを用いて、Direct-Vision-Based強化学習に基づき、単に視覚センサ信号をニューラルネットを入力し、円柱状の黒い物体に到達した際の報酬を元に、強化学習を行うだけで、物体に到達する行動を獲得できることを示した。
しかしながら、視覚センサはリニアタイプのものである上、入力の信号数は64と少なかった。そこで、今年度は、説得力を増すため、まず、リニアの視覚センサの代わりに、超小型CCDカメラを装着して、二次元画像で信号数1536という状況で、同様に物体到達運動が学習できるかを検証した。そして、試行回数の増大もほとんどなく、学習できることを確認した。
しかしながら、これでも、単に到達するだけでは画像上の黒い部分の重心を画面の中心で捕らえ、前進するという簡単な制御でも実現でき、タスクとして簡単であるため、より難しいタスクとして、横に寝かせた細長い直方体の物体を押すタスクを行った。この場合、単に到達するだけでなく、バランスを取って押すこと、さらには、単に物体に近づくだけでなく、その後に押すことを考慮して近づくことが必要となる。その結果、単に、物体を押したときに報酬を与え、見失ったときに罰を与えて数千試行の学習をさせるだけで、物体に近づいて押すことができるようになった。そして、画像上の物体の重心が同一であっても、物体の向きによって、近づき方も異なったものとなった。また、当初は、直方体の長辺に対して垂直に近づいて押すようになることを想定していたが、実際の学習後の行動は、予想とは異なっており、物体の滑りも考慮し、当初想定していた経路よりも短時間で物体を押して報酬を得るようになった。このように、画像処理も制御方法もタスクに関する情報も一切与えずに、物体を押す動作を学習によって獲得できることを示したのは、筆者が知る限り、世界でも本研究が初めてである。

報告書

(2件)
  • 2002 実績報告書
  • 2001 実績報告書
  • 研究成果

    (12件)

すべて その他

すべて 文献書誌 (12件)

  • [文献書誌] Masaru Iida, Masanori Sugisaka, Katsunari Shibata: "Application of Direct-Vision-Based Reinforcement Learning to a Real Mobile Robot with a CCD camera"Proc. of AROB (Int'l Symp. on Artificial Life and Robotics) 8th. Vol.1. 86-89 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Masaru Iida, Masanori Sugisaka, Katsunari Shibata: "Direct-Vision-Based Reinforcement Learning to a Real Mobile Robot"Proc. of Int'l Conf. of Neural Information Processing Systems (ICONIP '02). Vol.1. 2556-2560 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 飯田大, 杉坂政典, 柴田克成: "Direct-Vision-Based強化学習による小型CCDカメラ付き移動ロボットの行動獲得"第21回計測自動制御学会九州支部学術講演会予稿集. 109-112 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 柴田克成: "強化学習とロボットの知能-あめとむちで知能は作れるか?-,"第16回人工知能学会全国大会論文集 パネルディスカッション「強化学習とその諸相」. (CD-ROM). 2A1-05 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Katsunari Shibata, Koji Ito: "Hidden Representation after Reinforcement Learning of Hand Reaching Movement with Variable Link Length"Proc. of IJCNN (Int'l Conf. on Neural Networks) 2003. (発表予定). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Katsunari Shibata, Koji Ito: "Effect of Force Load in Hand Reaching Movement Acquired by Reinforcement Learning"Proc. of Int'l Conf. of Neural Information Processing Systems (ICONIP '02). Vol.3. 1444-1448 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 飯田 大, 杉坂 政典, 柴田 克成: "Direct-Vision-Based強化学習による視覚付き実移動ロボットの行動獲得"電子情報通信学会技術報告,ニューロコンピューティング研究会. (発表予定). (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 柴田 克成, 伊藤 宏司: "局所信号を入力としたニューラルネットの中間層における適応的空間再構成と汎化"電子情報通信学会技術報告,ニューロコンピューティング研究会. (発表予定). (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 前原 伸一, 杉坂 政典, 柴田 克成: "移動物体の捕獲行動学習におけるセンサ動作の比較"電子情報通信学会技術報告,ニューロコンピューティング研究会. (発表予定). (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Masaru Iida, M.Sngisaka, Katsunari Shibata: "Direct Vision-Based Reiforcement Learning in a Real Robot"Proc. of Artificial Life & Robotics(AROB)7th. Vol.1. 42-45 (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Katsunari Shibata, Masanori Sugisaka: "Dynamics of a Recurrent Neural Network Acquired through the Learning of a Context-based Attention Task"Proc. of Artificial Life & Robotics(AROB)7th. Vol.1. 152-155 (2002)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 飯田 大, 杉坂 政典, 柴田 克成: "Direct-Vision-Based強化学習による実移動ロボットの行動学習"計測自動制御学会情報・システム部門学術講演会2001講演論文集. 7-12 (2001)

    • 関連する報告書
      2001 実績報告書

URL: 

公開日: 2001-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi