有限状態空間、有限決定空間を持つマルコフ決定過程およびセミーマルコフ決定過程において、各定常政策に対する評価指標として無限期間総割引コストの期待値およびリスクの指標としての分散を取り上げ、これらを考慮した最適政策決定問題を提案し、問題の定式化と解析を行うことを目的とした。 1.連続時間マルコフ決定過程において、純定常政策を用いたときの総割引コストの分散を導くための計算式を導出した。また、混合政策に対しても同様のことを試みたが、困難性が高くいまだ成功していない。今後の課題としたい。次に、連続時間マルコフ的劣化システムを取り上げ、制御限界政策を採用した時の期待値および分散を陽に導き、期待値と分散を同時に考慮したときの最適制御限界状態の決定を数値的に分析した。 2.状態変化時点でコストが発生するセミーマルコフ過程に対し総割引コストの期待値と分散の導出方法について検討した。具体的な問題として信頼性システムにおけるブロック取替問題を考察し、分散は1サイクルにおける分析に帰着できることを明らかにした。 3.一つの良状態と一つの劣化状態を持つシステムを取り上げ、最適点検・取替政策問題を議論した。政策の評価規範として、総割引コストの期待値と分散を考慮し、それらを陽な形で導いた。この結果を基に期待値と分散を同時に考慮した点検政策快走問題を数値的に検討した。 これらの成果は論文として発表していないが、今後投稿の準備を予定している。
|