研究分担者 |
吉田 祐治 北九州大学, 経済学部, 教授 (90192426)
門田 良信 和歌山大学, 教育学部, 教授 (90116294)
丸山 研一 千葉大学, 教育学部, 助教授 (70173961)
剱持 信幸 千葉大学, 教育学部, 教授 (00033887)
鵜沢 正勝 千葉大学, 教育学部, 教授 (80009026)
|
研究概要 |
本研究は,ソフトで柔軟かつ融通のきく動的計画法(Dynamic Programming,以下DPと略記)の数理構造的理論の構築を目的として,具体的にマルコフ・セット連鎖モデル,ファジィ動的システムと停止問題,一般効用モデルについて解析研究を進めた.主な研究成果は次の通りである. 1. マルコフ・セット連鎖モデル 高度の頑健性(robustness)が要求される環境での決定過程をマルコフ・セット連鎖を用いて定式化(Controlled Markov Set-Chains)して,割引された期待利得をParetoの意味で最大にする政策をもとめるためのD.P.方程式を導出するのに成功した. 2. ファジィ動的システムと停止問題 ファジィ状態とファジィ推移を持つ動的システムのエルゴード定理が証明されて、関係するDP方程式の解の存在と一意性の証明を得た. さらに,ファジィ・ストピンングルール(fuzzy stopping rule)を導入して,ファジィ動的システムの最適停止問題を定式化し,D.P.の適用可能性の検討を通して,D.P.の適用範囲を拡大した. 3. 一般効用モデル 一般効用関数のもとでのマルコフ決定過程の期待効用最大化問題を,政策をパラメータとする分布族に依ってD.P.方程式を記述し最適解の存在とその特徴付けを行った.得られた結果は,指数型の従来の幾つかの結果を特別の場合に含み,動的計画法の適用範囲を拡大することに成っている. これらの研究結果は,学術論文に掲載又は掲載予定である。
|