• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

複雑な学習問題に対するPSOに基づく群強化学習法の適用

研究課題

研究課題/領域番号 22500131
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関京都工芸繊維大学

研究代表者

飯間 等  京都工芸繊維大学, 工芸科学研究科, 准教授 (70273547)

研究分担者 黒江 康明  京都工芸繊維大学, 工芸科学研究科, 教授 (10153397)
研究期間 (年度) 2010 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2012年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2011年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2010年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワード強化学習 / PSO / 群知能 / Particile Swarm Optimization / Particle Swarm Optimization
研究概要

短時間で最適な方策を学習するために、Particle Swarm Optimization(PSO)に基づく群強化学習法を提案し、連続状態行動空間を有する問題などの複雑な強化学習問題に提案方法を適用した。提案方法はエージェントと環境の組(これを学習世界と呼ぶ)を複数用意し、各学習世界のエージェントが個別に通常の強化学習法を用いて学習を行うとともに、PSO の更新式を用いた学習世界間の情報交換による学習も行う方法である。

報告書

(4件)
  • 2012 実績報告書   研究成果報告書 ( PDF )
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (29件)

すべて 2013 2012 2011 2010

すべて 雑誌論文 (11件) (うち査読あり 11件) 学会発表 (18件)

  • [雑誌論文] マルチエージェントタスクに対する群強化学習法2013

    • 著者名/発表者名
      山分翔太
    • 雑誌名

      計測自動制御学会論文集

      巻: 49 号: 3 ページ: 370-377

    • DOI

      10.9746/sicetr.49.370

    • NAID

      10031160127

    • ISSN
      0453-4654, 1883-8189
    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] 連続状態行動空間を有する問題に対する群強化学習法2012

    • 著者名/発表者名
      飯間 等、黒江康明
    • 雑誌名

      計測自動制御学会論文集

      巻: 48 号: 11 ページ: 790-798

    • DOI

      10.9746/sicetr.48.790

    • NAID

      130004549594

    • ISSN
      0453-4654, 1883-8189
    • 関連する報告書
      2012 実績報告書 2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Multi-Objective Reinforcement Learning Method for Acquiring All Pareto Optimal Policies Simultaneously2012

    • 著者名/発表者名
      Yusuke Mukai、Yasuaki Kuroe、Hitoshi Iima
    • 雑誌名

      Proceedings of 2012 IEEE International Conference on Systems, Man and Cybernetics

      ページ: 1917-1923

    • DOI

      10.1109/icsmc.2012.6378018

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Multi-Objective Reinforcement Learning Method for Acquiring All Pareto Optimal Policies Simultaneously2012

    • 著者名/発表者名
      Yusuke Mukai
    • 雑誌名

      Proceedings of 2012 IEEE International Conference on Systems, Man and Cybernetics

      巻: 1 ページ: 1917-1923

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Methods for Problems with Continuous State-Action Space2011

    • 著者名/発表者名
      Hitoshi Iima 、Yasuaki Kuroe 、Kazuo Emoto
    • 雑誌名

      Proceedings of 2011 IEEE International Conference on Systems, Man and Cybernetics

      ページ: 2173-2180

    • DOI

      10.1109/icsmc.2011.6083999

    • NAID

      10031128047

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Method for Multi-Agent Tasks-Solution of Dilemma Problems-2011

    • 著者名/発表者名
      Shota Yamawake, Hitoshi Iima, Yasuaki Kuroe
    • 雑誌名

      Proceedings of SICE Annual Conference 2011

      巻: (CD-ROM)

    • NAID

      10031160127

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Methods for Problems with Continuous State-Action Space2011

    • 著者名/発表者名
      Hitoshi Iima, Yasuaki Kuroe, Kazuo Emoto
    • 雑誌名

      Proceedings of IEEE International Conference on Systems, Man and Cybernetics

      巻: 1 ページ: 2173-2180

    • NAID

      10031128047

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Method Based on an Actor-Critic2010

    • 著者名/発表者名
      Hitoshi Iima 、Yasuaki Kuroe
    • 雑誌名

      Proceedings of Eighth International Conference on Simulated Evolution and Learning

      ページ: 279-288

    • DOI

      10.1007/978-3-642-17298-4_29

    • ISBN
      9783642172977, 9783642172984
    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Particle Swarm Optimizationによるリカレントスパイキングニューラルネットワークの学習法2010

    • 著者名/発表者名
      山本昌弘、黒江康明、飯間等
    • 雑誌名

      計測自動制御学会論文集

      巻: 46 ページ: 685-691

    • NAID

      10027445731

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Method Based on Ant Colony Optimization2010

    • 著者名/発表者名
      Hitoshi Iima, Yasuaki Kuroe, Shoko Matsuda
    • 雑誌名

      Proceedings of IEEE International Conference on Systems, Man and Cybernetics

      巻: 1 ページ: 1726-1733

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Method Based on an Actor-Critic Method2010

    • 著者名/発表者名
      Hitoshi Iima, Yasuaki Kuroe
    • 雑誌名

      Proceedings of Eighth International Conference on Simulated Evolution and Learning

      巻: 1

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [学会発表] Particle Swarm Optimization に基づくタイルコーディングを用いた強化学習法2013

    • 著者名/発表者名
      伊藤 洋
    • 学会等名
      計測自動制御学会第40回知能システムシンポジウ
    • 発表場所
      京都工芸繊維大学
    • 年月日
      2013-03-14
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Particle Swarm Optimizationに基づくタイルコーディングを用いた強化学習法2013

    • 著者名/発表者名
      伊藤 洋
    • 学会等名
      第40回知能システムシンポジウム
    • 発表場所
      京都工芸繊維大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 優越関係を用いたすべてのパレート最適方策を同時に獲得する多目的強化学習法2013

    • 著者名/発表者名
      向井悠祐
    • 学会等名
      第40回知能システムシンポジウム
    • 発表場所
      京都工芸繊維大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] あるクラスのジレンマ問題に対するマルチエージェント強化学習法2013

    • 著者名/発表者名
      高尾 晃
    • 学会等名
      第40回知能システムシンポジウム
    • 発表場所
      京都工芸繊維大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] フォーメーション形成問題に対するParticle Swarm Optimization に基づく群強化学習法2012

    • 著者名/発表者名
      飯間 等
    • 学会等名
      第57回システム制御情報学会研究発表講演会
    • 発表場所
      兵庫県民会館
    • 年月日
      2012-05-17
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] すべてのパレート最適方策を同時に獲得する多目的強化学習法2012

    • 著者名/発表者名
      向井悠祐
    • 学会等名
      第39回知能システムシンポジウム
    • 発表場所
      千葉大学
    • 年月日
      2012-03-16
    • 関連する報告書
      2011 実績報告書
  • [学会発表] ジレンマ問題に対するマルチエージェントタスク強化学習法2012

    • 著者名/発表者名
      山分翔太
    • 学会等名
      第39回知能システムシンポジウム
    • 発表場所
      千葉大学
    • 年月日
      2012-03-15
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 複数ロボットのフォーメーション形成問題に対する群強化学習法2012

    • 著者名/発表者名
      飯間 等
    • 学会等名
      第22回インテリジェント・システム・シンポジウム
    • 発表場所
      てだこホール
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 複数ロボットのフォーメーション形成問題に対する群強化学習法とその評価2012

    • 著者名/発表者名
      飯間 等
    • 学会等名
      計測自動制御学会システム・情報部門学術講演会2012
    • 発表場所
      ウィルあいち
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 高次元連続状態行動空間の問題に対する群強化学習法2011

    • 著者名/発表者名
      飯間 等
    • 学会等名
      計測自動制御学会システム・情報部門学術講演会2011
    • 発表場所
      東京都国立オリンピック記念青少年総合センター
    • 年月日
      2011-11-21
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 高次元連続状態行動空間の問題に対する群強化学習法2011

    • 著者名/発表者名
      飯間, 等
    • 学会等名
      システム・情報部門学術講演会2011
    • 発表場所
      東京都国立オリンピック記念青少年総合センター
    • 年月日
      2011-11-21
    • 関連する報告書
      2011 実績報告書
  • [学会発表] マルチエージェントタスクの群強化学習法による解法-ジレンマ問題に向けて-2011

    • 著者名/発表者名
      山分翔太
    • 学会等名
      第21回インテリジェント・システム・シンポジウム
    • 発表場所
      神戸大学
    • 年月日
      2011-09-02
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 寿命を設定した自己最良値を用いたParticle Swarm Optimizationに基づく群強化学習法2011

    • 著者名/発表者名
      飯間, 等
    • 学会等名
      第55回システム制御情報学会研究発表講演会
    • 発表場所
      大阪大学
    • 年月日
      2011-05-19
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 様々な発火パターンを実現するParticle Swarm Optimizationによるスパイキングニューラルネットワークの学習法2011

    • 著者名/発表者名
      山本昌弘
    • 学会等名
      第38回知能システムシンポジウム
    • 発表場所
      神戸
    • 年月日
      2011-03-17
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 寿命を設定した自己最良値を用いたParticle Swarm Optimization に基づく群強化学習法2010

    • 著者名/発表者名
      飯間 等
    • 学会等名
      計測自動制御学会システム・情報部門学術講演会2010 講演論文集
    • 発表場所
      キャンパスプラザ京都
    • 年月日
      2010-11-25
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 繰り返しN人囚人のジレンマ問題の群強化学習による解法2010

    • 著者名/発表者名
      山分翔太
    • 学会等名
      第20回インテリジェントシステム・シンポジウム
    • 発表場所
      東京
    • 年月日
      2010-09-25
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 寿命のある自己最良値を用いたParticle Swarm Optimization に基づく群強化学習法2010

    • 著者名/発表者名
      飯間 等
    • 学会等名
      第54回システム制御情報学会研究発表講演会
    • 発表場所
      京都リサーチパーク
    • 年月日
      2010-05-19
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 寿命のある自己最良値を用いたParticle Swarm Optimizationに基づく群強化学習法2010

    • 著者名/発表者名
      飯間等
    • 学会等名
      第54回システム制御情報学会研究発表講演会
    • 発表場所
      京都
    • 年月日
      2010-05-19
    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi