2011 年度実施状況報告書

相互依存型決定過程の創出

研究課題

研究課題/領域番号	23654038
研究機関	九州工業大学
研究代表者	藤田敏治九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)
研究期間 (年度)	2011-04-28 – 2014-03-31
キーワード	動的計画 / 相互依存型決定過程 / 加法型評価 / 結合型評価
研究概要	相互依存型決定過程という全く新しい型の多段決定過程構造の創出に向けて、その基礎となるモデルを構築し、いくつかの基本的結果を得た。相互依存型決定過程とは、複数の決定過程が、各々の各期の利得関数を通して互いに再帰的に依存している決定過程である。　まず、相互依存の概念を明確化するため、２つの決定過程－主過程と副過程とよぶ－に対する相互依存構造について解析した。各期の利得関数を通した相互依存関係が対象であり、主過程の利得関数と副過程の最適値の関係について、様々な観点から考察し、相互依存構造について検討を行った。　最初に扱ったモデルは、確定的推移システム上での２つの決定過程を対象とした加法型単純依存型過程である。本研究では、ステージ数および状態空間・決定空間は有限とした。それぞれの過程に対し部分問題を構成することで、相互に依存する最適方程式（再帰式）を導いた。その後、利得関数をより一般に最適値の関数と考え、目的関数については結合型評価（利得関数を結び付ける演算子を結合律を満たす演算子にまで一般化したもの）および結合型評価の関数まで広げた問題を扱った。この種の問題では、単純に部分問題を構成するだけでは最適方程式を導くことができなかった。そこで不変埋没の概念を用いることによって埋め込み問題を構成し、そして最適方程式を導出することに成功した。この場合、もはや最適政策のマルコフ性は成り立たず、政策クラスを一般政策まで広げて考える必要が生じた。もちろん最適一般政策の構成方法についても与えている。　また、相互依存型決定過程の適用例も与えた。ある特定の多角形から凸多面体が構成可能かどうかを判定する問題が、確定的推移システム上での相互依存型決定過程として定式化されることを示した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由２３年度は３つの達成目標を設定しており、それぞれについて述べる。　まず、「相互依存構造の定義と分類」については、複数の決定過程に対する相互依存構造について解析し、利得関数と最適値の間の相互依存の関係を明確化した。実際、一方の決定過程の利得関数が他方の決定過程の最適値に、どのような形で依存するかについて、直接依存の型と関数を通して依存する型を定めた。　次に、「比較的単純なモデルに対する最適方程式の導出」については、確定的推移システム上での２つの決定過程を対象とした加法型単純依存型過程から始め、目的関数として結合型評価および結合型評価の関数まで広げた問題に対し、不変埋没原理を駆使することにより最適方程式の導出に成功した。　また、「実問題への適用」については、ある種の多角形からの凸多面体構成問題が確定的推移システム上での相互依存型決定過程として定式化されることを示した。この問題自体は A. Lubiw と J. O'Rourke が「When can a polygon fold to a polytope?」（ Technical Report 048, Smith College, June 1996）で扱っていたものであるが、彼らの研究では、考察しているモデル自体が極めてあいまいに記述されていたのである。これに対し、本研究では相互依存型決定過程の概念を用いることで、的確にモデル化することに成功した。
今後の研究の推進方策	基本的に２３年度の成果を発展させていく。利得関数と最適値の関係について、より進んだ解析を行う。特に２４年度は、最適値のみならず、それを与える最適政策あるいは最適値を得るにいたった最終状態にも依存した利得関数の取り扱いについての検討を始める。実際問題への応用上、この種のモデルが必要となるとの認識を得ているためである。　また、複数（3つ以上）の決定過程への対応はもちろん、適用可能な推移システムについても拡大する。すなわち確率的推移、非決定性推移のもとでの相互依存型決定過程に対する最適方程式を導出を目指す。さらには、相互依存型決定過程の有用性を示すため、典型的な例題の提示や実際問題への適用を試みる。
次年度の研究費の使用計画	学会や各種研究会における成果発表・研究打合せのための旅費が主な使用目的となる。そのほかに、研究成果公表や資料整理のためのプリンター購入と書籍の購入、学会参加費への支出を予定している。

研究成果
(8件)

すべて 2012 2011

すべて雑誌論文 (2件) (うち査読あり 1件) 学会発表 (6件)

[雑誌論文] Threshold probability of non-terminal type2012
- 著者名/発表者名
  Akifumi Kira, Takayuki Ueno and Toshiharu Fujita
- 雑誌名
  
  Journal of Mathematical Analysis and Applications
  
  巻: 386 ページ: 461-472
- DOI
  doi:10.1016/j.jmaa.2011.08.006
- 査読あり
[雑誌論文] A Posteriori Conditional General Expected Value2012
- 著者名/発表者名
  Toshiharu Fujita and Takashi Akima
- 雑誌名
  
  Bulletin of the Kyushu Institute of Technology
  
  巻: 59 ページ: 7-19
[学会発表] 非決定性動的計画における加法-乗法型評価について2012
- 著者名/発表者名
  藤田敏治，秋間崇志
- 学会等名
  第７回DP研究会
- 発表場所
  九州工業大学
- 年月日
  2012年1月27日
[学会発表] 相互依存型決定過程について－評価系の拡張－2011
- 著者名/発表者名
  藤田敏治
- 学会等名
  日本数学会2011年度秋季総合分科会
- 発表場所
  信州大学
- 年月日
  2011年9月29日
[学会発表] Mutually Dependent Decision Processes2011
- 著者名/発表者名
  Toshiharu Fujita
- 学会等名
  IFORS 2011
- 発表場所
  Melbourne Convention Centre
- 年月日
  2011年7月14日
[学会発表] 結合型評価をもつ相互依存型決定過程2011
- 著者名/発表者名
  藤田敏治
- 学会等名
  京都大学数理解析研究所研究集会：不確実・不確定環境下における数理的意思決定とその周辺
- 発表場所
  京都大学数理解析研究所
- 年月日
  2011年11月7日
[学会発表] 有限マルコフ決定過程～流動性リスク最小化モデル～2011
- 著者名/発表者名
  吉良知文，藤田敏治，植野貴之
- 学会等名
  DP部会合同シンポジウム2011
- 発表場所
  千葉大学
- 年月日
  2011年10月16日
[学会発表] 動的計画の一般モデルと汎用ソルバー2011
- 著者名/発表者名
  藤田敏治
- 学会等名
  DP部会合同シンポジウム2011
- 発表場所
  千葉大学
- 年月日
  2011年10月15日

2011 年度 実施状況報告書

相互依存型決定過程の創出

研究代表者

藤田 敏治 九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Threshold probability of non-terminal type2012

著者名/発表者名

雑誌名

DOI

[雑誌論文] A Posteriori Conditional General Expected Value2012

著者名/発表者名

雑誌名

[学会発表] 非決定性動的計画における加法-乗法型評価について2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 相互依存型決定過程について－評価系の拡張－2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Mutually Dependent Decision Processes2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 結合型評価をもつ相互依存型決定過程2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 有限マルコフ決定過程～流動性リスク最小化モデル～2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 動的計画の一般モデルと汎用ソルバー2011

著者名/発表者名

学会等名

発表場所

年月日

2011 年度実施状況報告書

藤田敏治九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)