• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

意思決定過程における時間差分制御の研究とその応用

Research Project

Project/Area Number 19740060
Research InstitutionKanagawa University

Principal Investigator

堀口 正之  Kanagawa University, 工学部, 准教授 (90366401)

Keywordsマルコフ決定過程 / 計画数学 / 区間ベイズ推定法 / 確信区間
Research Abstract

本年度は、マルコフ決定過程における未知の推移法則の推定方法について、状態の逐次観測から得られるデータセットに基づいた区間ベイズ推定法を用いて、推移確率行列の区間表現を得るための計算手法の考察を行った。推定される推移確率行列は、それぞれの成分が事後区間として表され、データ観測数に依存した高次多項方程式の解として特徴づけられる。その解の導出方法について、ニュートンラフソン法と不完全ベータ関数により、数値近似解を得る計算アルゴリズムを示した。また、不完全ベータ関数によって表される高次方程式の解法と分数計画問題における双対問題の解法との関係についても明らかにした。これらの手法を元にして、事後区間表現を構成するためのデータテーブルを準備しておくことで、観測から得る任意のデータセットに対して区間推移確率行列を容易に得ることが出来る。これは、区間推定マルコフ決定過程を構成する上で有益な計算手法を明らかにしたと言える。
また、事後区間の推定方法として、確信区間に基づく区間表現方法についても考察を行った。具体的には、事後測度区間によるパーセンタイルを求め、確信度に応じた推移確率行列の事後区間表現について区間の上限および下限を不完全ベータ関数によって表現できることも示した。
研究集会および学会にてこれらの成果を発表した。推移確率行列が区間で表現されるマルコフ決定過程において、状態観測から事後区間を推定する逐次学習を行っていく新たな適応型学習の手法を確立する上で重要な成果である。

  • Research Products

    (3 results)

All 2010 2009

All Journal Article (1 results) Presentation (2 results)

  • [Journal Article] 不確実性の下でのマルコフ決定過程に対する区間ベイズ手法2009

    • Author(s)
      伊喜哲一郎、堀口正之、安田正實、蔵野正美
    • Journal Title

      京都大学数理解析研究所講究録 1636

      Pages: 1-8

  • [Presentation] Uncertain Markov decision processes and Bayesian intervals2010

    • Author(s)
      堀口正之
    • Organizer
      日本数学会
    • Place of Presentation
      慶應義塾大学矢上キャンパス
    • Year and Date
      2010-03-26
  • [Presentation] On bounds for Bayes estimate intervals in uncertain MDPs2009

    • Author(s)
      堀口正之、安田正實
    • Organizer
      日本数学会
    • Place of Presentation
      大阪大学豊中キャンパス
    • Year and Date
      2009-09-27

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi