Research Abstract |
確率動的計画法(Markov決定過程を含む)は,経済学・経営学における様々な不確実状況下の動的意思決定問題や工学に現れる色々な確率システムの動的最適化を扱う上で有効な数学的手法である。しかしながら,従来扱われてきた通常の確率動的計画法では,システムの評価尺度としてただつ1つのみを許しており,様々な評価尺度を同時に考慮する必要のある現実問題にうまく適用することができないことが少なくない.一方,近年,複数の評価規範を要する確率的システムの動的最適化を目標として:1.制約を持つ確率動的計画法,2.多目的確率動的計画法の研究が活発になされ始めてきている.筆者自身も,上記1.の制約を持つ確率動的計画法に対して,若干の結果を得ることができており,国際会議,学会,研究集会などの諸機会に報告してきた.本研究プロジェクトの目的は1.に関するこれらの成果をより発展させるとともに,あらたに2.に対しても問題の定式化の段階から始め,最適政策の論理的特徴づけとその計算アルゴリズムの開発および様々な問題への応用へと広範囲にわたる研究への端緒を開くことであった.特に制約を持つMarkov決定過程にかんしては,この数年の間に,多くの研究論文が発表されてきているため,まず,制約を持つMarkov決定過程,多目的Markov決定過程を初めとしたMarkov決定過程に関する最近の研究動向を網羅的に調べ,サーベイを行った.また,複数の評価尺度を要する確率システムの動的最適化問題への適用例として,計算機システムへの応用を念頭においたモデルのもとで,待ち行列システムの最適制御問題に関する研究を行った.手始めに,評価規範としては,制約を持たない通常のMarkov決定過程に定式化するに止めたが,制約を持つMarkov決定過程としての定式化の方が実際的には自然であり,この定式化のもとでの最適制御問題に関しては今後の課題としたい.
|