研究課題/領域番号 |
23654038
|
研究機関 | 九州工業大学 |
研究代表者 |
藤田 敏治 九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 動的計画 / 相互依存型決定過程 / 加法型評価 / 結合型評価 |
研究概要 |
相互依存型決定過程という全く新しい型の多段決定過程構造の創出に向けて、その基礎となるモデルを構築し、いくつかの基本的結果を得た。相互依存型決定過程とは、複数の決定過程が、各々の各期の利得関数を通して互いに再帰的に依存している決定過程である。 まず、相互依存の概念を明確化するため、2つの決定過程 - 主過程と副過程とよぶ - に対する相互依存構造について解析した。各期の利得関数を通した相互依存関係が対象であり、主過程の利得関数と副過程の最適値の関係について、様々な観点から考察し、相互依存構造について検討を行った。 最初に扱ったモデルは、確定的推移システム上での2つの決定過程を対象とした加法型単純依存型過程である。本研究では、ステージ数および状態空間・決定空間は有限とした。それぞれの過程に対し部分問題を構成することで、相互に依存する最適方程式(再帰式)を導いた。その後、利得関数をより一般に最適値の関数と考え、目的関数については結合型評価(利得関数を結び付ける演算子を結合律を満たす演算子にまで一般化したもの)および結合型評価の関数まで広げた問題を扱った。この種の問題では、単純に部分問題を構成するだけでは最適方程式を導くことができなかった。そこで不変埋没の概念を用いることによって埋め込み問題を構成し、そして最適方程式を導出することに成功した。この場合、もはや最適政策のマルコフ性は成り立たず、政策クラスを一般政策まで広げて考える必要が生じた。もちろん最適一般政策の構成方法についても与えている。 また、相互依存型決定過程の適用例も与えた。ある特定の多角形から凸多面体が構成可能かどうかを判定する問題が、確定的推移システム上での相互依存型決定過程として定式化されることを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
23年度は3つの達成目標を設定しており、それぞれについて述べる。 まず、「相互依存構造の定義と分類」については、複数の決定過程に対する相互依存構造について解析し、利得関数と最適値の間の相互依存の関係を明確化した。実際、一方の決定過程の利得関数が他方の決定過程の最適値に、どのような形で依存するかについて、直接依存の型と関数を通して依存する型を定めた。 次に、「比較的単純なモデルに対する最適方程式の導出」については、確定的推移システム上での2つの決定過程を対象とした加法型単純依存型過程から始め、目的関数として結合型評価および結合型評価の関数まで広げた問題に対し、不変埋没原理を駆使することにより最適方程式の導出に成功した。 また、「実問題への適用」については、ある種の多角形からの凸多面体構成問題が確定的推移システム上での相互依存型決定過程として定式化されることを示した。この問題自体は A. Lubiw と J. O'Rourke が「When can a polygon fold to a polytope?」( Technical Report 048, Smith College, June 1996)で扱っていたものであるが、彼らの研究では、考察しているモデル自体が極めてあいまいに記述されていたのである。これに対し、本研究では相互依存型決定過程の概念を用いることで、的確にモデル化することに成功した。
|
今後の研究の推進方策 |
基本的に23年度の成果を発展させていく。利得関数と最適値の関係について、より進んだ解析を行う。特に24年度は、最適値のみならず、それを与える最適政策あるいは最適値を得るにいたった最終状態にも依存した利得関数の取り扱いについての検討を始める。実際問題への応用上、この種のモデルが必要となるとの認識を得ているためである。 また、複数(3つ以上)の決定過程への対応はもちろん、適用可能な推移システムについても拡大する。すなわち確率的推移、非決定性推移のもとでの相互依存型決定過程に対する最適方程式を導出を目指す。さらには、相互依存型決定過程の有用性を示すため、典型的な例題の提示や実際問題への適用を試みる。
|
次年度の研究費の使用計画 |
学会や各種研究会における成果発表・研究打合せのための旅費が主な使用目的となる。そのほかに、研究成果公表や資料整理のためのプリンター購入と書籍の購入、学会参加費への支出を予定している。
|