研究概要 |
研究実施計画の役割分担に従って,下記の研究成果を得た. (1)研究代表者は,割引型マルコフ決定過程における閾値確率最適化問題において,8個の問題を考え,2つの同値類に分類し,それぞれの同値類の特徴づけを与え,同値類間の関係を与えた.また,これらの概念を目標集合をもつ非割引型問題と確率最短路問題に拡張・適用した.さらに,最適停止問題に閾値確率最小化の概念を導入し,特徴づけを行い,秘書問題等に応用した.これらの成果は論文としてまとめ,発表または発表予定である. (2)安田正實は,ファジイ報酬をもつマルコフ決定過程において,無限期間最適値が特殊な作用素に関する最適方程式の一意解であることを示し,パレート最適政策の特徴付けを与えた.この成果は論文として掲載された. (3)岩本誠一は,不変埋め込み法を用いて前向きの再帰評価関数をもつ有限期間確率最適化問題を動的計画法により解決した.前向きの評価関数は,加法型,乗法型,最小型,終端型を含む.この成果は論文として掲載された. (4)新関章三は,スターリングの公式の証明の簡略化のために,剰余項の付いた台形公式を用いて証明した.この成果は論文としてまとめられ掲載された. (5)野間口謙太郎は,不完全データに関する最尤推定を求めるEMアルゴリズムの収束に対して,よく知られたWu (1983)の条件に不備があることを示し,反例を与えた.この成果は論文としてまとめられ印刷中である.
|