1997 年度実績報告書

動的計画法の数理構造的研究

研究課題

研究課題/領域番号	09640243
研究種目	基盤研究(C)
研究機関	千葉大学
研究代表者	蔵野正美千葉大学, 教育学部, 教授 (70029487)
研究分担者	吉田祐治北九州大学, 経済学部, 教授 (90192426) 門田良信和歌山大学, 教育学部, 教授 (90116294) 丸山研一千葉大学, 教育学部, 助教授 (70173961) 剱持信幸千葉大学, 教育学部, 教授 (00033887) 鵜沢正勝千葉大学, 教育学部, 教授 (80009026)
キーワード	動的計画法 / マルコフ決定過程 / ファジイ動的計画法 / マルコフ・セット連鎖 / 一般効用最適化 / 最適方程式 / ファジイ決定 / 最適政策
研究概要	本研究は、ソフトで柔軟かつ融通のきく動的計画法(以下D.Pと略記)の数理構造的理論の構築を目的として、具体的にマルコフ・セット連鎖モデル、一般効用関数モデル、ファジイ決定モデルについて解析研究を行っている。主な研究成果は次の通りである。 1.推移確率法則がある領域に含まれていることのみが既知である決定過程をマルコフ・セット連鎖を用いて定式化(Controlled Markov Set-Chains)して、割引された期待利得をParetoの意味で最大にする政策をもとめるためのD.P.方程式を導出するのに成功した。 2.一般効用関数のもとでのマルコフ決定過程の期待効用最大化問題を、政策をパラメータとする分布族に依ってD.P.方程式を記述し最適解の存在とその特徴付けを行っている。得られた結果は、指数型の従来の幾つかの結果を特別の場合に含み、動的計画法の適用範囲を拡大することに成っている。 3.L.A.Zadehの拡張原理を適用して、マルコフ性をもつ決定的過程をファジイ化し、ファジイ決定過程を定式化した。ファジイ数に関するFuzzy max-orderのもとでの最適解を求めるためのD.P.方程式を導き、解の存在と一意性の証明を得た。これらの研究結果は、Fuzzy Sets and Systems(Vo1.94,1998、PP.109-119).Journal of Applied Probability(1998)、International Transaction in Operational Research(Vol.4,1998)等の学術雑誌に掲載予定であり、京都大学数理解析研究所の研究集会や数学会で口答発表している。その他、本研究に参加した研究者は、本研究の実施計画に基づき、それぞれ一定の成果を納め、研究論文として発表している。

研究成果
(6件)

すべてその他

すべて文献書誌 (6件)

[文献書誌] 剱持,信幸(共著): "Global attractors of time-dependent double obstacle problems" Funct.Anal.Global Anal.,Springer-Verlag,Singapore. 288-301 (1997)
[文献書誌] 吉田,祐治(共著): "A limit theorem in some dynamic fuzzy systems with a monotone property" Fuzzy Set and Systems. 94. 109-119 (1998)
[文献書誌] 蔵野,正美(共著): "Controlled Markov set-chains with discounting" To appear in Journal of Applied Probability. (1998)
[文献書誌] 門田,良信(共著): "On the general utility of discounted Markov decision processes" To appear in International Transaction in Operational Research. 4. (1998)
[文献書誌] 蔵野,正美(共著): "The time average reward for some dynamic fuzzy systems" To appear in Computers and Mathematics with Applications.
[文献書誌] 蔵野,正美(共著): "A fuzzy relational equation in dynamic fuzzy systems" To appear in Fuzzy Sets and Systems.

1997 年度 実績報告書

動的計画法の数理構造的研究

研究代表者

蔵野 正美 千葉大学, 教育学部, 教授 (70029487)

研究成果

[文献書誌] 剱持,信幸(共著): "Global attractors of time-dependent double obstacle problems" Funct.Anal.Global Anal.,Springer-Verlag,Singapore. 288-301 (1997)

[文献書誌] 吉田,祐治(共著): "A limit theorem in some dynamic fuzzy systems with a monotone property" Fuzzy Set and Systems. 94. 109-119 (1998)

[文献書誌] 蔵野,正美(共著): "Controlled Markov set-chains with discounting" To appear in Journal of Applied Probability. (1998)

[文献書誌] 門田,良信(共著): "On the general utility of discounted Markov decision processes" To appear in International Transaction in Operational Research. 4. (1998)

[文献書誌] 蔵野,正美(共著): "The time average reward for some dynamic fuzzy systems" To appear in Computers and Mathematics with Applications.

[文献書誌] 蔵野,正美(共著): "A fuzzy relational equation in dynamic fuzzy systems" To appear in Fuzzy Sets and Systems.

1997 年度実績報告書

蔵野正美千葉大学, 教育学部, 教授 (70029487)