• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Performance Analysis of a Reinforcement Learning Agent Using Multivariate Analysis Method Based on Dimension Reduction

Research Project

Project/Area Number 19500172
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeSingle-year Grants
Section一般
Research Field Perception information processing/Intelligent robotics
Research InstitutionHachinohe National College of Technology

Principal Investigator

KAMAYA Hiroyuki  Hachinohe National College of Technology, 電気情報工学科, 教授 (70224657)

Co-Investigator(Kenkyū-buntansha) 工藤 憲昌  独立行政法人国立高等専門学校機構八戸工業高等専門学校, 電気情報工学科, 教授 (40270194)
Co-Investigator(Renkei-kenkyūsha) KUDOH Norimasa  八戸工業高等専門学校, 電気情報工学科, 教授 (40270194)
Project Period (FY) 2007 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2008: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2007: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Keywords強化学習 / 関数近似 / 自律移動ロボット / 機械学習 / エージェント / 統計数学 / ハイパフォーマンス・コンピューティング / 知能ロボティクス
Research Abstract

高次元の連続状態空間を直接扱うことのできるモデル追加型の強化学習アルゴリズムを開発した。このアルゴリズムの最大の特徴は、関数近似器のパラメータをうまく設定することで、モデル数を小さく抑えつつも良好な学習性能を実現できる点にある。このため、まず、パラメータの挙動解析を行い、最良のパラメータを見出した。つぎに、10次元の連続状態空間をもつ移動ロボットの移動障害物回避問題に適用し、有効性を確認した。

Report

(3 results)
  • 2008 Annual Research Report   Final Research Report ( PDF )
  • 2007 Annual Research Report
  • Research Products

    (11 results)

All 2009 2008 2007

All Journal Article (4 results) (of which Peer Reviewed: 3 results) Presentation (7 results)

  • [Journal Article] 関数近似手法を用いた強化学習アルゴリズム2008

    • Author(s)
      釜谷博行、藤村敦子、工藤憲昌、阿部健一
    • Journal Title

      八戸工業高等専門学校紀要 43号

      Pages: 65-68

    • NAID

      110007126392

    • Related Report
      2008 Final Research Report
    • Peer Reviewed
  • [Journal Article] 関数近似手法を用いた強化学習アルゴリズム2008

    • Author(s)
      釜谷博行, 藤村敦子, 工藤憲昌, 阿部健一
    • Journal Title

      八戸工業高等専門学校紀要 43

      Pages: 23-27

    • NAID

      110007126392

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 連続状態空間のための強化学習アルゴリズム2007

    • Author(s)
      釜谷博行、 阿部健一
    • Journal Title

      八戸工業高等専門学校紀要 42号

      Pages: 65-68

    • NAID

      110007126370

    • Related Report
      2008 Final Research Report
    • Peer Reviewed
  • [Journal Article] 連続状態空間のための強化学習アルゴリズム2007

    • Author(s)
      釜谷博行, 阿部健一
    • Journal Title

      八戸工業高等専門学校紀要 42

      Pages: 65-68

    • NAID

      110007126370

    • Related Report
      2007 Annual Research Report
  • [Presentation] 高次元連続状態空間における強化学習-局所重み付き回帰手法を用いた価値関数近似-2009

    • Author(s)
      一井宏次、釜谷博行、工藤憲
    • Organizer
      計測自動制御学会
    • Place of Presentation
      八戸工業高等専門学校
    • Year and Date
      2009-06-19
    • Related Report
      2008 Final Research Report
  • [Presentation] 局所重み付き回帰手法を用いた強化学習2009

    • Author(s)
      一井宏次、釜谷博行、阿部健一
    • Organizer
      電気学会全国大会
    • Place of Presentation
      北海道大学
    • Year and Date
      2009-03-19
    • Related Report
      2008 Final Research Report
  • [Presentation] 局所重み付き回帰手法を用いた強化学習2009

    • Author(s)
      一井宏次, 釜谷博行, 阿部健一
    • Organizer
      平成21年電気学会全国大会
    • Place of Presentation
      北海道大学
    • Year and Date
      2009-03-19
    • Related Report
      2008 Annual Research Report
  • [Presentation] 強化学習のための局所重み付き回帰手法を用いた価値関数近似2008

    • Author(s)
      一井宏次、釜谷博行
    • Organizer
      電気関係学会
    • Place of Presentation
      日本大学工学部
    • Year and Date
      2008-08-22
    • Related Report
      2008 Final Research Report
  • [Presentation] 強化学習のための局所重み付き回帰手法を用いた価値関数近似2008

    • Author(s)
      一井宏次, 釜谷博行
    • Organizer
      平成20年度電気関係学会東北支部連合大会
    • Place of Presentation
      日本大学工学部
    • Year and Date
      2008-08-22
    • Related Report
      2008 Annual Research Report
  • [Presentation] 適応周波数推定法の検討とその一応用2007

    • Author(s)
      工藤憲昌、田所嘉昭
    • Organizer
      計測自動制御学会
    • Place of Presentation
      八戸工業大学
    • Year and Date
      2007-06-15
    • Related Report
      2008 Final Research Report
  • [Presentation] 適応周波数推定法の検討とその一応用2007

    • Author(s)
      工藤憲昌, 田所嘉昭
    • Organizer
      計測自動制御学会東北支部第236回研究集会
    • Place of Presentation
      八戸工業大学
    • Year and Date
      2007-06-15
    • Related Report
      2007 Annual Research Report

URL: 

Published: 2007-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi