• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

群強化学習法の開発

研究課題

研究課題/領域番号 19650031
研究種目

萌芽研究

配分区分補助金
研究分野 知能情報学
研究機関京都工芸繊維大学

研究代表者

飯間 等  京都工芸繊維大学, 工芸科学研究科, 准教授 (70273547)

研究分担者 黒江 康明  京都工芸繊維大学, 工芸科学研究科, 教授 (10153397)
研究期間 (年度) 2007 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
1,800千円 (直接経費: 1,800千円)
2008年度: 800千円 (直接経費: 800千円)
2007年度: 1,000千円 (直接経費: 1,000千円)
キーワード強化学習 / Particle Swarm Optimization / アントコロニー最適化法 / 群知能
研究概要

通常の強化学習では一つのエージェントのみを用いて学習を行うので複雑な問題では学習に時間がかかりすぎるという欠点がある。したがって、強化学習の実用化に向けて学習を高速に行う新しい方法を開発することが必要不可欠である。本研究では、短時間で学習を行うために複数のエージェントを用意し、各エージェントが通常の強化学習法で学習を行うとともに、エージェント間の情報交換により他のエージェントの学習成果を参照して学習を行う群強化学習法を提案した。
本年度は、鳥の群れ行動にヒントを得た最適化手法であるParticle Swarm Optimizationを用いた群強化学習法におけるエージェント間の情報交換方法を提案した。また、各エージェントが行う個別学習法として、SarsaやActor-Criticを用いた方法を提案した。また、より複雑な問題に対する群強化学習法の有効性を検証するために、倒立振子制御問題、サッカーゲーム問題、マルチエージェント環境の問題に群強化学習法を適用し、これらの問題に対しても短時間に良い方策を獲得できることを確認した。さらに、蟻の群れ行動にヒントを得た最適化手法であるアントコロニー最適化法を用いた群強化学習法を提案した。この群強化学習法では他のエージェントの学習成果を行動選択に利用する新しい枠組みを用いている。以上の成果より、従来の1エージェント強化学習法より短時間に良い方策を獲得できる群強化学習法を開発することができた。

報告書

(2件)
  • 2008 実績報告書
  • 2007 実績報告書
  • 研究成果

    (14件)

すべて 2009 2008 2007

すべて 雑誌論文 (5件) (うち査読あり 5件) 学会発表 (9件)

  • [雑誌論文] Swarm Reinforcement Learning Algorithms Based on Sarsa Method2008

    • 著者名/発表者名
      Hitoshi Iima, Yasuaki Kuroe
    • 雑誌名

      Proceedings of SICE Annual Conference 2008

      ページ: 2045-2049

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforceient Learning Algori thms Based on Particle Swarm Optimization2008

    • 著者名/発表者名
      Hitoshi Iima, Yasuaki Kuroe
    • 雑誌名

      Proceedings of 2008 International Conference on Systerns, Man and Cybernetics

      ページ: 1110-1115

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 各個体の自律探索機能を強化したParticle Swarm Optimization2008

    • 著者名/発表者名
      飯間 等
    • 雑誌名

      計測自動制御学会論文集 44

      ページ: 61-70

    • NAID

      10020126978

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Swarm Reinforcement Learning Algorithms-Exchange of Informationamong Multiple Agents2007

    • 著者名/発表者名
      Hitoshi Iima
    • 雑誌名

      SICE Annual Conference 2007 Proceedings

      ページ: 2779-2784

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Particle Swarm Optimization with Enhanced Autonomous Search Ability2007

    • 著者名/発表者名
      Hitoshi Iima
    • 雑誌名

      Proceedings of the 7th International Conference on Optimization: Techniques and Applications

    • NAID

      130006980491

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [学会発表] 群強化学習法のサッカーゲーム問題への適用2009

    • 著者名/発表者名
      馬場口豊, 黒江康明, 飯間等
    • 学会等名
      第36回知能システムシンポジウム
    • 発表場所
      京都
    • 年月日
      2009-03-18
    • 関連する報告書
      2008 実績報告書
  • [学会発表] マルチエージェントタスクに対する群強化学習法の適用2009

    • 著者名/発表者名
      野口直起, 黒江康明, 飯間等
    • 学会等名
      第36回知能システムシンポジウム
    • 発表場所
      京都
    • 年月日
      2009-03-17
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Actor-Criticを用いた群強化学習法-情報交換の方法とその性能評価-2008

    • 著者名/発表者名
      飯間等, 黒江康明
    • 学会等名
      計測自動制御学会システム・情報部門学術講演会2008
    • 発表場所
      姫路
    • 年月日
      2008-11-28
    • 関連する報告書
      2008 実績報告書
  • [学会発表] フェロモンに基づく行動選択手法を用いた群強化学習法とその性能評価2008

    • 著者名/発表者名
      松田祥子, 黒江康明, 飯間等
    • 学会等名
      計測自動制御学会 システム・情報部門学術講演会2008
    • 発表場所
      姫路
    • 年月日
      2008-11-26
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 連続状態行動空間におけるActor-Criticを用いた群強化学習法2008

    • 著者名/発表者名
      飯間等, 黒江康明
    • 学会等名
      第52回システム制御情報学会研究発表講演会
    • 発表場所
      京都
    • 年月日
      2008-05-17
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Actor-Criticを用いた群強化学習法2008

    • 著者名/発表者名
      飯間 等
    • 学会等名
      第35回知能システムシンポジウム
    • 発表場所
      東京
    • 年月日
      2008-03-17
    • 関連する報告書
      2007 実績報告書
  • [学会発表] フェロモンに基づく行動選択手法を用いた群強化学習法2008

    • 著者名/発表者名
      松田祥子
    • 学会等名
      第35回知能システムシンポジウム
    • 発表場所
      東京
    • 年月日
      2008-03-17
    • 関連する報告書
      2007 実績報告書
  • [学会発表] アントコロニー最適化法に基づく群強化学習法とその性能評価2007

    • 著者名/発表者名
      松田祥子
    • 学会等名
      システム・情報部門学術講演会2007
    • 発表場所
      東京
    • 年月日
      2007-11-26
    • 関連する報告書
      2007 実績報告書
  • [学会発表] アントコロニー最適化法に基づく群強化学習法2007

    • 著者名/発表者名
      松田祥子
    • 学会等名
      第51回システム制御情報学会研究発表講演会
    • 発表場所
      京都
    • 年月日
      2007-05-16
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2007-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi