2005 Fiscal Year Annual Research Report
Project/Area Number |
15540105
|
Research Institution | Chiba University |
Principal Investigator |
蔵野 正美 千葉大学, 教育学部, 教授 (70029487)
|
Co-Investigator(Kenkyū-buntansha) |
剱持 信幸 千葉大学, 教育学部, 教授 (00033887)
安田 正實 千葉大学, 理学部, 教授 (00041244)
中神 潤一 千葉大学, 理学部, 教授 (30092076)
門田 良信 和歌山大学, 教育学部, 教授 (90116294)
吉田 裕治 北九州市立大学, 経済学部, 教授 (90192426)
|
Keywords | 柔構造決定モデル / 知覚情報 / ファジィ最適方程式 / 適応型マルコフモデル / 一般効用決定モデル / マルコフ決定過程 / 強化学習 / 適応政策 |
Research Abstract |
意思決定過程に関する柔構造モデルの構成及び解析法についての平成17年度の主な研究成果は次の通りである。 1.知覚情報の多次元停止モデルの研究 知覚情報の下での多人数による最適停止問題をファジィ集合と単調論理関数を用いてモデル化して、均衡解の見積り値(perceptive equilibrium point)を求める逐次的ファジィ最適関係式を導いた。 2.適応型マルコフ決定モデルの研究 推移確率行列が未知の有限マルコフ決定過程の適応政策の構成の問題を取り扱い、communicating caseに対して、最尤推定法とreward-penalty型の強化学習アルゴリズムを融合的に組み合わせて、いわゆる、「探索と記憶のジレンマ」を克服した適応政策の存在を構成的に示した。 3.一般効用(リグレット)決定モデルの研究 吸収壁のあるマルコフ決定過程及びセミ・マルコフ決定過程に対して、2次元リグレット関数を用いてリグレット最適化モデルを構成し、最適解とその性質についていくつかの解析結果を得た。 これらの研究結果は、研究会(数理研の研究集会など)、数学会(2006年3月、中央大学)等で発表した。 さらに、つぎの2つの国際会議でも発表した(著者:蔵野、安田、中神、吉田)。 ・Modeling Decisions for Artificial Intelligence MDAI 2005、July 25-27,2005,Tsukuba Japan 発表題目「Perceptive evaluation for the optimal discounted reward in MDPs」Proceedings pp.283-293 ・Eleventh International Fuzzy Systems Association, World Congress, July 28-31,2005.Beijing 発表題目「Fuzzy optimality equations for perceptive MDPs」Proceedings, Vol.III pp.1811-1815 その他、本研究に参加した研究者は、本研究の実施計画に基づき、一定の成果をおさめ、研究論文として発表している。
|
Research Products
(3 results)