1999 年度研究成果報告書概要

総割引コストの分散を考慮したマルコフ決定過程とその応用に関する研究

研究課題

研究課題/領域番号	10680430
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	社会システム工学
研究機関	鳥取大学
研究代表者	河合一鳥取大学, 工学部, 教授 (50026316)
研究分担者	小柳淳二鳥取大学, 工学部, 助手 (90225590)
研究期間 (年度)	1998 – 1999
キーワード	マルコフ決定過程 / 総割引コスト / 期待値 / 分散 / マルコフ劣化システム / 再生過程 / 年齢取替 / ブロック取替
研究概要	有限状態空間、有限決定空間を持つマルコフ決定過程およびセミーマルコフ決定過程において、各定常政策に対する評価指標として無限期間総割引コストの期待値およびリスクの指標としての分散を取り上げ、これらを考慮した最適政策決定問題を提案し、問題の定式化と解析を行うことを目的とした。 1.連続時間マルコフ決定過程において、純定常政策を用いたときの総割引コストの分散を導くための計算式を導出した。また、混合政策に対しても同様のことを試みたが、困難性が高くいまだ成功していない。今後の課題としたい。次に、連続時間マルコフ的劣化システムを取り上げ、制御限界政策を採用した時の期待値および分散を陽に導き、期待値と分散を同時に考慮したときの最適制御限界状態の決定を数値的に分析した。 2.状態変化時点でコストが発生するセミーマルコフ過程に対し総割引コストの期待値と分散の導出方法について検討した。具体的な問題として信頼性システムにおけるブロック取替問題を考察し、分散は1サイクルにおける分析に帰着できることを明らかにした。 3.一つの良状態と一つの劣化状態を持つシステムを取り上げ、最適点検・取替政策問題を議論した。政策の評価規範として、総割引コストの期待値と分散を考慮し、それらを陽な形で導いた。この結果を基に期待値と分散を同時に考慮した点検政策快走問題を数値的に検討した。これらの成果は論文として発表していないが、今後投稿の準備を予定している。