• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

大脳情報処理模倣型強化学習システム

研究課題

研究課題/領域番号 20500207
研究機関山口大学

研究代表者

小林 邦和  山口大学, 大学院・理工学研究科, 助教 (40263793)

研究分担者 大林 正直  山口大学, 大学院・理工学研究科, 教授 (60213849)
呉本 尭  山口大学, 大学院・理工学研究科, 助教 (40294657)
キーワード強化学習 / マルチエージェント / 大脳情報処理 / 状態予測 / 自律構成 / モジュール構造 / 協調行動 / ロボット
研究概要

平成20年度は主にマルチエージェントシステムの創発現象の定式化と計算機上の仮想環境における性能評価を行った.詳細は以下の通りである.
1.マルチエージェントシステムにおけるミクローマクロ・ループの現象について,統計物理学的手法を用いて定式化を行った.具体的には,マルチエージェントシステムにおける個々のエージェント(自律的に行動する主体)を統計物理におけるミクロな粒子,またエージェント同士の相互作用により生じる秩序を統計物理におけるマクロな現象と捉える.
2.上記の枠組みの下で,マルチエージェントシステムにおける協調行動の創発を目的とした新しい大脳情報処理模倣型強化学習システムを提案した.提案システムは,他エージェントの状態予測機能と階層とモジュールの自律構成機能を併せ持ち,外部環境の変化に柔軟に適応する能力を持っている.各モジュールは,次状態の予測を行う状態予測器と行動決定を行う行動制御器を内部に持つ.提案システムでは,ヒトの大脳における情報処理機構に倣い感覚器官から高次機能まで抽象レベルを階層状に表現し,また同一レベルにおいてモジュールを複数配置することで,状態空間の整理を行い,学習の効率化を図っている
3.計算機上の仮想環境におけるシミュレーションにより,提案法がマルチエージェント環境において,協調行動を創発していることを示した.
4.次年度以降に行う自律移動ロボットを用いた現実環境における創発現象(協調行動の創発)の実現のための,ハードウェア環境の構築を行った.

  • 研究成果

    (23件)

すべて 2009 2008

すべて 雑誌論文 (10件) (うち査読あり 10件) 学会発表 (13件)

  • [雑誌論文] 状態予測型強化学習システム2008

    • 著者名/発表者名
      小林邦和, 他
    • 雑誌名

      電気学会論文誌 128-C

      ページ: 1303-1311

    • 査読あり
  • [雑誌論文] 一時的滞留機能を持つ過渡的カオス連想記憶モデル2008

    • 著者名/発表者名
      大林正直, 他
    • 雑誌名

      電気学会論文誌 128-C

      ページ: 1852-1858

    • 査読あり
  • [雑誌論文] A Dynamic Associative Memory System Adopting Amygdala Model2008

    • 著者名/発表者名
      T. Kuremoto, et al.
    • 雑誌名

      Artificial Life and Robotics 13

      ページ: 478-482

    • 査読あり
  • [雑誌論文] A Robust Reinforcement Learning Using Concept of Sliding Mode Control2008

    • 著者名/発表者名
      M. Obayashi, et al.
    • 雑誌名

      Artificial Life and Robotics 13

      ページ: 526-530

    • 査読あり
  • [雑誌論文] A Reinforcement Learning Method Based on Immune Network Adapted to Semi Markov Decision Process2008

    • 著者名/発表者名
      N. Kogawa, et al.
    • 雑誌名

      Artificial Life and Robotics 13

      ページ: 538-542

    • 査読あり
  • [雑誌論文] A Reinforcement Learning System for Swarm Behaviors2008

    • 著者名/発表者名
      T. Kuremoto, et al.
    • 雑誌名

      Proceedings of the 2008 IEEE World Congress on Computational Intelligence

      ページ: 3710-3715

    • 査読あり
  • [雑誌論文] A Neuro-fuzzy Learning System for Adaptive Swarm Behaviors Dealing with Continuous State Space2008

    • 著者名/発表者名
      T. Kuremoto, et al.
    • 雑誌名

      Lecture Notes in Computer Science 5227

      ページ: 675-683

    • 査読あり
  • [雑誌論文] A Reinforcement Learning System with Chaotic Neural Networks-Based Adaptive Hierarchical Memory Structure for Autonomous Robots2008

    • 著者名/発表者名
      M. Obayashi, et al.
    • 雑誌名

      Proceedings of International Conference on Control, Automation and Systems

      ページ: 69-74

    • 査読あり
  • [雑誌論文] A Bayesian Local Linear Wavelet Neural Network2008

    • 著者名/発表者名
      K. Kobayashi, et al.
    • 雑誌名

      Proceedings of International Conference on Neural Information Processing

      ページ: 113-114

    • 査読あり
  • [雑誌論文] A Self-Organized Fuzzy-Neuro Reinforcement Learning System for Continuous State Space for Autonomous Robots2008

    • 著者名/発表者名
      M. Obayashi, et al.
    • 雑誌名

      Proceedings of International Conference on Computational Intelligence for Modelling, Control and Automation

      ページ: 69-74

    • 査読あり
  • [学会発表] 大脳辺縁系モデルの構築2009

    • 著者名/発表者名
      呉本 尭, 他
    • 学会等名
      第21回自律分散システム・シンポジウム
    • 発表場所
      とりぎん文化会舘(鳥取市)
    • 年月日
      2009-01-22
  • [学会発表] Transient-SOMの改良及び音声命令学習への応用2009

    • 著者名/発表者名
      古本 隆人, 他
    • 学会等名
      第21回自律分散システム・シンポジウム
    • 発表場所
      とりぎん文化会舘(鳥取市)
    • 年月日
      2009-01-22
  • [学会発表] 階差時系列を用いたニューラルネットワークによる時系列予測2009

    • 著者名/発表者名
      波多 聡, 他
    • 学会等名
      第21回自律分散システム・シンポジウム
    • 発表場所
      とりぎん文化会舘(鳥取市)
    • 年月日
      2009-01-22
  • [学会発表] 学習分類子システムを用いた強化学習(XCS QT)の性能評価2008

    • 著者名/発表者名
      尾崎 智香, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] 自律移動ロボットによるマップ作成とゴール探索2008

    • 著者名/発表者名
      河村 佳代子, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] アントコロニー最適化法におけるランダム選択率設定方法2008

    • 著者名/発表者名
      永田 昌彦, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] ランダムタイリングを用いたモジュール型強化学習2008

    • 著者名/発表者名
      松井 裕之, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] TD誤差を用いた強化学習のメタパラメータ学習法2008

    • 著者名/発表者名
      溝上 裕之, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] 不完全観測環境下におけるスライディングモード制御の概念を利用した強化学習システム2008

    • 著者名/発表者名
      山田 勝巳, 他
    • 学会等名
      第17回計測自動制御学会中国支部学術講演会
    • 発表場所
      広島大学(東広島市)
    • 年月日
      2008-11-15
  • [学会発表] 局所線形ウェーブレットニューラルネットワークのベイズ的設計法2008

    • 著者名/発表者名
      小林 邦和, 他
    • 学会等名
      第18回日本神経回路学会合同大会
    • 発表場所
      産業技術総合研究所(つくば市)
    • 年月日
      2008-09-25
  • [学会発表] アントコロニー最適化法における上位ランク限定ランダム選択方式2008

    • 著者名/発表者名
      永田 昌彦, 他
    • 学会等名
      電子・情報・システム部門大会
    • 発表場所
      はこだて未来大学(函館市)
    • 年月日
      2008-08-21
  • [学会発表] 局所線形モデルを導入したウェーブレッドニューラルネットワークのベイズ的設計法2008

    • 著者名/発表者名
      小林 邦和, 他
    • 学会等名
      電子・情報・システム部門大会
    • 発表場所
      はこだて未来大学(函館市)
    • 年月日
      2008-08-20
  • [学会発表] TD誤差に基づく強化学習のメタパラメータ学習法2008

    • 著者名/発表者名
      溝上 裕之, 他
    • 学会等名
      電子・情報・システム部門大会
    • 発表場所
      はこだて未来大学(函館市)
    • 年月日
      2008-08-20

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi