• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

意思決定過程における時間差分制御の研究とその応用

研究課題

研究課題/領域番号 19740060
研究機関神奈川大学

研究代表者

堀口 正之  神奈川大学, 工学部, 准教授 (90366401)

キーワードマルコフ決定過程 / 計画数学 / 区間ベイズ推定法 / 確信区間
研究概要

本年度は、マルコフ決定過程における未知の推移法則の推定方法について、状態の逐次観測から得られるデータセットに基づいた区間ベイズ推定法を用いて、推移確率行列の区間表現を得るための計算手法の考察を行った。推定される推移確率行列は、それぞれの成分が事後区間として表され、データ観測数に依存した高次多項方程式の解として特徴づけられる。その解の導出方法について、ニュートンラフソン法と不完全ベータ関数により、数値近似解を得る計算アルゴリズムを示した。また、不完全ベータ関数によって表される高次方程式の解法と分数計画問題における双対問題の解法との関係についても明らかにした。これらの手法を元にして、事後区間表現を構成するためのデータテーブルを準備しておくことで、観測から得る任意のデータセットに対して区間推移確率行列を容易に得ることが出来る。これは、区間推定マルコフ決定過程を構成する上で有益な計算手法を明らかにしたと言える。
また、事後区間の推定方法として、確信区間に基づく区間表現方法についても考察を行った。具体的には、事後測度区間によるパーセンタイルを求め、確信度に応じた推移確率行列の事後区間表現について区間の上限および下限を不完全ベータ関数によって表現できることも示した。
研究集会および学会にてこれらの成果を発表した。推移確率行列が区間で表現されるマルコフ決定過程において、状態観測から事後区間を推定する逐次学習を行っていく新たな適応型学習の手法を確立する上で重要な成果である。

  • 研究成果

    (3件)

すべて 2010 2009

すべて 雑誌論文 (1件) 学会発表 (2件)

  • [雑誌論文] 不確実性の下でのマルコフ決定過程に対する区間ベイズ手法2009

    • 著者名/発表者名
      伊喜哲一郎、堀口正之、安田正實、蔵野正美
    • 雑誌名

      京都大学数理解析研究所講究録 1636

      ページ: 1-8

  • [学会発表] Uncertain Markov decision processes and Bayesian intervals2010

    • 著者名/発表者名
      堀口正之
    • 学会等名
      日本数学会
    • 発表場所
      慶應義塾大学矢上キャンパス
    • 年月日
      2010-03-26
  • [学会発表] On bounds for Bayes estimate intervals in uncertain MDPs2009

    • 著者名/発表者名
      堀口正之、安田正實
    • 学会等名
      日本数学会
    • 発表場所
      大阪大学豊中キャンパス
    • 年月日
      2009-09-27

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi