• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

群強化学習法の開発

Research Project

Project/Area Number 19650031
Research InstitutionKyoto Institute of Technology

Principal Investigator

飯間 等  Kyoto Institute of Technology, 工芸科学研究科, 助教 (70273547)

Co-Investigator(Kenkyū-buntansha) 黒江 康明  京都工芸繊維大学, 工芸科学研究科, 教授 (10153397)
Keywords強化学習 / Particle Swarm Optimization / アントコロニー最適化法 / 群知能
Research Abstract

通常の強化学習では一つのエージェントのみを用いて学習を行うので複雑な問題では学習に時間がかかりすぎるという欠点がある。したがって、強化学習の実用化に向けて学習を高速に行う新しい方法を開発することが必要である。本研究では、短時間で学習を行うために複数のエージェントを用意し、各エージェントが通常の強化学習法で学習を行うとともに、エージェント間の情報交換により他のエージェントの学習成果を参照して学習を行う群強化学習法を提案した。
本年度は、主として、鳥の群れ行動にヒントを得た最適化手法であるParticle Swarm Optimizationの基本アルゴリズムを改良するとともに、強化学習問題をQ値の最適化問題と捉えてParticle Swarm OptimizationをQ-learningに組み込んだ群強化学習法を提案した。Particle Swarm Optimizationを組み込んだ群強化学習法では、Particle Swarm Optimizationの解候補更新式に基づいて自己最良Q値と全体最良Q値を導入し、これらの最良Q値を利用して各エージェントのQ値を更新するが、その更新手続きには種々の方法が考えられる。そこで、本年度の研究では種々のQ値の更新方法を提案し、計算機を用いた数値実験を通して各更新方法の有効性を検証した。その結果、従来の1エージェントのQ-learningより短時間に良い方策を獲得できる群強化学習法を開発することができた。また、蟻の群れ行動にヒントを得た最適化手法であるアントコロニー最適化法をQ-learningに組み込んだ群強化学習法の基礎的検討を行った。

  • Research Products

    (7 results)

All 2008 2007

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (4 results)

  • [Journal Article] 各個体の自律探索機能を強化したParticle Swarm Optimization2008

    • Author(s)
      飯間 等
    • Journal Title

      計測自動制御学会論文集 44

      Pages: 61-70

    • Peer Reviewed
  • [Journal Article] Swarm Reinforcement Learning Algorithms-Exchange of Informationamong Multiple Agents2007

    • Author(s)
      Hitoshi Iima
    • Journal Title

      SICE Annual Conference 2007 Proceedings

      Pages: 2779-2784

    • Peer Reviewed
  • [Journal Article] Particle Swarm Optimization with Enhanced Autonomous Search Ability2007

    • Author(s)
      Hitoshi Iima
    • Journal Title

      Proceedings of the 7th International Conference on Optimization: Techniques and Applications

    • Peer Reviewed
  • [Presentation] Actor-Criticを用いた群強化学習法2008

    • Author(s)
      飯間 等
    • Organizer
      第35回知能システムシンポジウム
    • Place of Presentation
      東京
    • Year and Date
      2008-03-17
  • [Presentation] フェロモンに基づく行動選択手法を用いた群強化学習法2008

    • Author(s)
      松田祥子
    • Organizer
      第35回知能システムシンポジウム
    • Place of Presentation
      東京
    • Year and Date
      2008-03-17
  • [Presentation] アントコロニー最適化法に基づく群強化学習法とその性能評価2007

    • Author(s)
      松田祥子
    • Organizer
      システム・情報部門学術講演会2007
    • Place of Presentation
      東京
    • Year and Date
      2007-11-26
  • [Presentation] アントコロニー最適化法に基づく群強化学習法2007

    • Author(s)
      松田祥子
    • Organizer
      第51回システム制御情報学会研究発表講演会
    • Place of Presentation
      京都
    • Year and Date
      2007-05-16

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi