研究課題/領域番号 |
09640243
|
研究種目 |
基盤研究(C)
|
研究機関 | 千葉大学 |
研究代表者 |
蔵野 正美 千葉大学, 教育学部, 教授 (70029487)
|
研究分担者 |
吉田 祐治 北九州大学, 経済学部, 教授 (90192426)
門田 良信 和歌山大学, 教育学部, 教授 (90116294)
丸山 研一 千葉大学, 教育学部, 助教授 (70173961)
剱持 信幸 千葉大学, 教育学部, 教授 (00033887)
鵜沢 正勝 千葉大学, 教育学部, 教授 (80009026)
|
キーワード | 動的計画法 / マルコフ決定過程 / ファジイ動的計画法 / マルコフ・セット連鎖 / 一般効用最適化 / 最適方程式 / ファジイ決定 / 最適政策 |
研究概要 |
本研究は、ソフトで柔軟かつ融通のきく動的計画法(以下D.Pと略記)の数理構造的理論の構築を目的として、具体的にマルコフ・セット連鎖モデル、一般効用関数モデル、ファジイ決定モデルについて解析研究を行っている。主な研究成果は次の通りである。 1.推移確率法則がある領域に含まれていることのみが既知である決定過程をマルコフ・セット連鎖を用いて定式化(Controlled Markov Set-Chains)して、割引された期待利得をParetoの意味で最大にする政策をもとめるためのD.P.方程式を導出するのに成功した。 2.一般効用関数のもとでのマルコフ決定過程の期待効用最大化問題を、政策をパラメータとする分布族に依ってD.P.方程式を記述し最適解の存在とその特徴付けを行っている。得られた結果は、指数型の従来の幾つかの結果を特別の場合に含み、動的計画法の適用範囲を拡大することに成っている。 3.L.A.Zadehの拡張原理を適用して、マルコフ性をもつ決定的過程をファジイ化し、ファジイ決定過程を定式化した。ファジイ数に関するFuzzy max-orderのもとでの最適解を求めるためのD.P.方程式を導き、解の存在と一意性の証明を得た。 これらの研究結果は、Fuzzy Sets and Systems(Vo1.94,1998、PP.109-119).Journal of Applied Probability(1998)、International Transaction in Operational Research(Vol.4,1998)等の学術雑誌に掲載予定であり、京都大学数理解析研究所の研究集会や数学会で口答発表している。その他、本研究に参加した研究者は、本研究の実施計画に基づき、それぞれ一定の成果を納め、研究論文として発表している。
|