1994 Fiscal Year Annual Research Report
連続時間ベクトル値マルコフ決定過程の凸最適解の研究
Project/Area Number |
06640324
|
Research Institution | University of Miyazaki |
Principal Investigator |
伊喜 哲一郎 宮崎大学, 教育学部, 助教授 (80041010)
|
Co-Investigator(Kenkyū-buntansha) |
梶木屋 龍治 宮崎大学, 工学部, 助教授 (10183261)
米山 俊昭 宮崎大学, 工学部, 助教授 (40175021)
山田 直記 宮崎大学, 工学部, 教授 (50030789)
川野 日郎 宮崎大学, 教育学部, 教授 (20040983)
緒方 明夫 宮崎大学, 教育学部, 教授 (80040921)
|
Keywords | マルコフ連鎖 / マルコフ決定過程 / ベクトル値決定論 |
Research Abstract |
以下の2つの研究集会にて講演を行い成果の発表を行った。 [I]平成6年11月10日,京都大学数理解析研究所における研究集会にて 題目:「(U,V,W)基準をもつベクトル値マルコフ決定過程について」 として数値計算例を含めて講演した。 理論的側面の一部の結果は,同研究所の講究録に収録され印刷中である。次の[II]の研究の基礎となる部分であり,割引率を伴う単一のマルコフ連鎖を中心にして,推移確率行列に対する固有多項式の正定値性と余因数行列との関係を明らかにした。 [II]平成6年12月7日-12月9日 創価大学理工学部における研究集会にて 題目:「多重連鎖をなすベクトル値マルコフ決定過程について」 として講演した。 結果は研究集会誌 「不確実性の下での最適化理論とその関連分野」P.8-17 に収録され概要を印刷発表した。ここに,[II]の講演内容の要旨を報告する。 内容:ベクトル値の有限マルコフ決定過程において,マルコフ推移確率行列の中に潜む部分連鎖の数に応じた最適性の判定法に関する理論を構築した。それは Lemma2.1-2.4 および定理4.1-4.3から構成されている。平均型基準値,相対値および準相対値の系列をもち,優劣の判定がベクトル値による半順序で決定される最適化方程式と大域的最適解の発見法が与えられた。これによって最適政策の決定法を導いた。[I]および[II]の数値計算例はページ数の関係で未収録である。その分は平成7年度の宮崎大学教育学部の研究紀要等で発表する予定である。理論的側面を中心にした部分は,外国雑誌等にこれから投稿する予定である。
|
Research Products
(2 results)
-
[Publications] 伊喜 哲一郎: "(U,V,W)基準を持つベクトル値マルコフ決定過程について" 京都大学数理解析研究所講究録. (1995)
-
[Publications] 伊喜 哲一郎: "多重連鎖をなすベクトル値マルコフ決定過程について" 平成6年度科学研究費報告集 不確実性の下での最適化理論とその関連分野. 8-17 (1995)