2011 Fiscal Year Research-status Report

相互依存型決定過程の創出

Research Project

Project/Area Number	23654038
Research Institution	Kyushu Institute of Technology
Principal Investigator	藤田敏治九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)
Project Period (FY)	2011-04-28 – 2014-03-31
Keywords	動的計画 / 相互依存型決定過程 / 加法型評価 / 結合型評価
Research Abstract	相互依存型決定過程という全く新しい型の多段決定過程構造の創出に向けて、その基礎となるモデルを構築し、いくつかの基本的結果を得た。相互依存型決定過程とは、複数の決定過程が、各々の各期の利得関数を通して互いに再帰的に依存している決定過程である。　まず、相互依存の概念を明確化するため、２つの決定過程－主過程と副過程とよぶ－に対する相互依存構造について解析した。各期の利得関数を通した相互依存関係が対象であり、主過程の利得関数と副過程の最適値の関係について、様々な観点から考察し、相互依存構造について検討を行った。　最初に扱ったモデルは、確定的推移システム上での２つの決定過程を対象とした加法型単純依存型過程である。本研究では、ステージ数および状態空間・決定空間は有限とした。それぞれの過程に対し部分問題を構成することで、相互に依存する最適方程式（再帰式）を導いた。その後、利得関数をより一般に最適値の関数と考え、目的関数については結合型評価（利得関数を結び付ける演算子を結合律を満たす演算子にまで一般化したもの）および結合型評価の関数まで広げた問題を扱った。この種の問題では、単純に部分問題を構成するだけでは最適方程式を導くことができなかった。そこで不変埋没の概念を用いることによって埋め込み問題を構成し、そして最適方程式を導出することに成功した。この場合、もはや最適政策のマルコフ性は成り立たず、政策クラスを一般政策まで広げて考える必要が生じた。もちろん最適一般政策の構成方法についても与えている。　また、相互依存型決定過程の適用例も与えた。ある特定の多角形から凸多面体が構成可能かどうかを判定する問題が、確定的推移システム上での相互依存型決定過程として定式化されることを示した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason ２３年度は３つの達成目標を設定しており、それぞれについて述べる。　まず、「相互依存構造の定義と分類」については、複数の決定過程に対する相互依存構造について解析し、利得関数と最適値の間の相互依存の関係を明確化した。実際、一方の決定過程の利得関数が他方の決定過程の最適値に、どのような形で依存するかについて、直接依存の型と関数を通して依存する型を定めた。　次に、「比較的単純なモデルに対する最適方程式の導出」については、確定的推移システム上での２つの決定過程を対象とした加法型単純依存型過程から始め、目的関数として結合型評価および結合型評価の関数まで広げた問題に対し、不変埋没原理を駆使することにより最適方程式の導出に成功した。　また、「実問題への適用」については、ある種の多角形からの凸多面体構成問題が確定的推移システム上での相互依存型決定過程として定式化されることを示した。この問題自体は A. Lubiw と J. O'Rourke が「When can a polygon fold to a polytope?」（ Technical Report 048, Smith College, June 1996）で扱っていたものであるが、彼らの研究では、考察しているモデル自体が極めてあいまいに記述されていたのである。これに対し、本研究では相互依存型決定過程の概念を用いることで、的確にモデル化することに成功した。
Strategy for Future Research Activity	基本的に２３年度の成果を発展させていく。利得関数と最適値の関係について、より進んだ解析を行う。特に２４年度は、最適値のみならず、それを与える最適政策あるいは最適値を得るにいたった最終状態にも依存した利得関数の取り扱いについての検討を始める。実際問題への応用上、この種のモデルが必要となるとの認識を得ているためである。　また、複数（3つ以上）の決定過程への対応はもちろん、適用可能な推移システムについても拡大する。すなわち確率的推移、非決定性推移のもとでの相互依存型決定過程に対する最適方程式を導出を目指す。さらには、相互依存型決定過程の有用性を示すため、典型的な例題の提示や実際問題への適用を試みる。
Expenditure Plans for the Next FY Research Funding	学会や各種研究会における成果発表・研究打合せのための旅費が主な使用目的となる。そのほかに、研究成果公表や資料整理のためのプリンター購入と書籍の購入、学会参加費への支出を予定している。

Research Products
(8 results)

All 2012 2011

All Journal Article (2 results) (of which Peer Reviewed: 1 results) Presentation (6 results)

[Journal Article] Threshold probability of non-terminal type2012
- Author(s)
  Akifumi Kira, Takayuki Ueno and Toshiharu Fujita
- Journal Title
  
  Journal of Mathematical Analysis and Applications
  
  Volume: 386 Pages: 461-472
- DOI
  doi:10.1016/j.jmaa.2011.08.006
- Peer Reviewed
[Journal Article] A Posteriori Conditional General Expected Value2012
- Author(s)
  Toshiharu Fujita and Takashi Akima
- Journal Title
  
  Bulletin of the Kyushu Institute of Technology
  
  Volume: 59 Pages: 7-19
[Presentation] 非決定性動的計画における加法-乗法型評価について2012
- Author(s)
  藤田敏治，秋間崇志
- Organizer
  第７回DP研究会
- Place of Presentation
  九州工業大学
- Year and Date
  2012年1月27日
[Presentation] 相互依存型決定過程について－評価系の拡張－2011
- Author(s)
  藤田敏治
- Organizer
  日本数学会2011年度秋季総合分科会
- Place of Presentation
  信州大学
- Year and Date
  2011年9月29日
[Presentation] Mutually Dependent Decision Processes2011
- Author(s)
  Toshiharu Fujita
- Organizer
  IFORS 2011
- Place of Presentation
  Melbourne Convention Centre
- Year and Date
  2011年7月14日
[Presentation] 結合型評価をもつ相互依存型決定過程2011
- Author(s)
  藤田敏治
- Organizer
  京都大学数理解析研究所研究集会：不確実・不確定環境下における数理的意思決定とその周辺
- Place of Presentation
  京都大学数理解析研究所
- Year and Date
  2011年11月7日
[Presentation] 有限マルコフ決定過程～流動性リスク最小化モデル～2011
- Author(s)
  吉良知文，藤田敏治，植野貴之
- Organizer
  DP部会合同シンポジウム2011
- Place of Presentation
  千葉大学
- Year and Date
  2011年10月16日
[Presentation] 動的計画の一般モデルと汎用ソルバー2011
- Author(s)
  藤田敏治
- Organizer
  DP部会合同シンポジウム2011
- Place of Presentation
  千葉大学
- Year and Date
  2011年10月15日

2011 Fiscal Year Research-status Report

相互依存型決定過程の創出

Principal Investigator

藤田 敏治 九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Threshold probability of non-terminal type2012

Author(s)

Journal Title

DOI

[Journal Article] A Posteriori Conditional General Expected Value2012

Author(s)

Journal Title

[Presentation] 非決定性動的計画における加法-乗法型評価について2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 相互依存型決定過程について－評価系の拡張－2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Mutually Dependent Decision Processes2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 結合型評価をもつ相互依存型決定過程2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 有限マルコフ決定過程～流動性リスク最小化モデル～2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 動的計画の一般モデルと汎用ソルバー2011

Author(s)

Organizer

Place of Presentation

Year and Date

藤田敏治九州工業大学, 工学(系)研究科(研究院), 准教授 (60295003)