有限個の状態および有限個の決定を持つマルコフ決定過程において、各政策に対する評価指標として無限期間における総割引コストの期待値およびコストのばらつきを示す分散を取り上げ、これら二つの指標を同時に考慮した最適政策決定問題を提案し、問題の定式化とそれらの解析を行うことを目的とした。 1. 連続時間マルコフ決定過程において、純定常政策を用いたときの総割引コストの分散を導くための計算式を与えた。次に、混合政策を用いた時の分散の導出を試みたが、困難な点が多く現在険討中である。具体的な適用例として、連続時聞マルコフ劣化システムを取り上げ、制御限界政策に従ったときの総割引コストの期待値及び分散を求め、期待値と分散を共に考慮した時の最適限界状態について数値的に分析した。 2. セミ-マルコフ過程の特別な場合である再生時にコストを件う再生過程において、総割引コストの期待値及び分散の導出方法について検討した。時間平均コストについての解析は1サイクルについての解析だけで十分であるのと同様に、総割引コストの期待値と分散についても1サイクルでの分析に帰着されることを明らかにした。具体例として、信頼性システムの年齢取替え問題とブロック取替え問題を取り上げ、それぞれに対し分敗を導いた。さらに、故障峙間が指数分布およびアーラン分布に従う場合において期待値と分散の一方の制約の下で他方を最小化する問題を提案し、最適予防取替え時期について解析的および数値的に分析した。
|