• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

複雑な環境における脳の意思決定モデルとロボット制御への応用

研究課題

研究課題/領域番号 18300101
研究機関奈良先端科学技術大学院大学

研究代表者

石井 信  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (90294280)

研究分担者 中村 泰  大阪大学, 大学院・工学研究科, 助手 (70403334)
柴田 智広  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (40359873)
キーワード教科学習 / 部分観測 / 前頭前野 / 意思決定 / 計算論的認知心理学 / サンプリング / 多自由度ロボット
研究概要

線形確率システムとして表現できないような複雑な環境における最適意思決定過程を模擬する機械学習モデルを、強化学習に注目して構築し、工学応用、特に多自由度ロボットに対して変動する環境下での自律制御を行った。高度で階層的な推論を必要とするタスクを題材として、複雑な問題解決に関わる階層的な脳内モデルを構築し、非侵襲脳活動計測器を用いた認知科学実験により検証した。
1.強化学習のアルゴリズム開発
方策勾配法ベースの方策オフ型強化学習法に注目しながら新しい強化学習アルゴリズムを開発した。サンプリングに基づく部分観測マルコフ決定過程の解法を開発し、4人で行うマルチエージェントゲームであるHeartsの効率よい自動学習に成功した(Fujita and Ishii, in press)。
2.階層的部分観測環境における神経基盤
部分観測課題における最適意思決定過程の神経基盤を調べるために、fMRIを用いた認知科学実験を行い、前部前頭前野の関わりを明らかにした(Yoshida and Ishii,2006)。また、階層性ある意思決定課題においては、前頭前野の異なる領域が関わることが分かった。
3.多自由度ロボットの強化学習法による制御
方策勾配方策オフ型強化学習法を、2足準受動歩行ロボット実機に実装し、通常の強化学習法よりも早く安定して学習が可能であることが分かった(Ueno et al.,2006)。中枢パターン生成器に対する強化学習法をヘビ型ロボットに適用し、アクチュエータの故障などシステムの動的変化に追随できることを示した(Makino et al.,2007)。

  • 研究成果

    (16件)

すべて 2006

すべて 雑誌論文 (15件) 図書 (1件)

  • [雑誌論文] Reinforcement learning for quasi-passive dynamic walking of an unstable biped robot2006

    • 著者名/発表者名
      K.Hitomi
    • 雑誌名

      Robotics and Autonomous Systems 54(12)

      ページ: 982-988

  • [雑誌論文] 適応的サンプリングによる階層モデル化された対象の効率的状態推定2006

    • 著者名/発表者名
      坂東 誉司
    • 雑誌名

      システム制御情報学会論文誌 50(10)

      ページ: 369-377

  • [雑誌論文] The role of short time depression in sustained neural activity in the prefrontal cortex : A simulation study2006

    • 著者名/発表者名
      Y.Igarashi
    • 雑誌名

      Neural Networks 19(8)

      ページ: 1137-1152

  • [雑誌論文] Switching particle filters for efficient visual tracking2006

    • 著者名/発表者名
      T.Bando
    • 雑誌名

      Journal of Robotics and Autonomous Systems 54

      ページ: 873-884

  • [雑誌論文] Balancing plasticity and stability of on-line learning based on hierarchical Bayesian adaptation of forgetting factors2006

    • 著者名/発表者名
      J.Hirayama
    • 雑誌名

      Neurocomputing 69

      ページ: 1954-1961

  • [雑誌論文] Stochastic resonance with a differential code in a cortical model2006

    • 著者名/発表者名
      Y.Sakumura
    • 雑誌名

      Neural Networks 19

      ページ: 469-476

  • [雑誌論文] 重点サンプリング法に基づくNatural Actor-Critic法による効果的なサンプルの再利用2006

    • 著者名/発表者名
      森 健
    • 雑誌名

      電子情報通信学会論文誌 J89-D(5)

      ページ: 954-966

  • [雑誌論文] 学習ダイナミクスの制御と脳の物質機構2006

    • 著者名/発表者名
      銅谷 賢治
    • 雑誌名

      トステム/制御/情報 50(8)

      ページ: 303-308

  • [雑誌論文] Reinforcement learning : machine learning and natural learning2006

    • 著者名/発表者名
      S.Ishii
    • 雑誌名

      New Generation Computing 24

      ページ: 325-350

  • [雑誌論文] Adaptive control of a looper-like robot based on the CPG-actor-critic method.2006

    • 著者名/発表者名
      K.Makino
    • 雑誌名

      International Symposium on Artificial Life and Robotics

      ページ: GS18-5

  • [雑誌論文] On-line variational PCA for adaptive visual tracking2006

    • 著者名/発表者名
      T.Date
    • 雑誌名

      International Symposium on Artificial Life and Robotics

      ページ: GS18-5

  • [雑誌論文] A probabilistic modeling of MOSAIC learning2006

    • 著者名/発表者名
      S.Osaga
    • 雑誌名

      International Symposium on Artificial Life and Robotics

      ページ: GS16-3

  • [雑誌論文] Estimation of source-filter model via acoustical feature extraction by GA-like algorithm2006

    • 著者名/発表者名
      M.Ihara
    • 雑誌名

      International Symposium on Artificial Life and Robotics

      ページ: GS12-4

  • [雑誌論文] Fast and Stable Learning of Quasi-Passive Dynamic Walking by an Unstable Biped Robot based on Off-Policy Natural Actor-Critic2006

    • 著者名/発表者名
      T.Ueno
    • 雑誌名

      IEEE/RSJ International Conference on Intelligent Robots and Systems

      ページ: 5226-5231

  • [雑誌論文] Feature extraction for decision-theoretic planning in partially observable environments2006

    • 著者名/発表者名
      H.Fujita
    • 雑誌名

      Artificial Neural Networks - ICANN 2006, Lecture Notes in Computation Science 4132

      ページ: I-820-829

  • [図書] Bayesian Brain (Chapter 1 : A probability primer)2006

    • 著者名/発表者名
      K.Doya
    • 総ページ数
      323
    • 出版者
      MIT Press

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi