• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 研究成果報告書

報酬が動的に変化する環境における事前知識を活用する強化学習

研究課題

  • PDF
研究課題/領域番号 24760308
研究種目

若手研究(B)

配分区分基金
研究分野 システム工学
研究機関筑波大学

研究代表者

澁谷 長史  筑波大学, システム情報系, 助教 (90582776)

研究期間 (年度) 2012-04-01 – 2016-03-31
キーワード強化学習
研究成果の概要

試行錯誤のさなかに報酬が変化する環境において、変化に関する事前知識を活用した効率的な強化学習方法を実現することである。強化学習には、多くの潜在的アプリケーションが期待されている反面、「ある行動を選択することの望ましいは時間に対して不変である」という仮定があり、時間とともに性質が変化する対象を学習できないという本質的な課題がある。本研究では、この実現の切り口として、変化に関する事前知識を活用した手法について研究を進めた。環境にあわせた事前知識を用いて、時間に対して報酬が周期性を持つ環境、方位に対して報酬が周期性を持つ環境、状態遷移確率が変化する環境などのための学習方式を明らかにした。

自由記述の分野

機械学習

URL: 

公開日: 2017-05-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi