研究課題/領域番号 |
20K19884
|
研究機関 | 山口大学 |
研究代表者 |
上田 仁彦 山口大学, 大学院創成科学研究科, 講師 (00826571)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 繰り返しゲーム / ゼロ行列式戦略 / 負けない戦略 / 模倣戦略 / しっぺ返し戦略 / 相互強化学習 / ポテンシャルゲーム / 社会的ジレンマ |
研究実績の概要 |
繰り返しゲームにおけるゼロ行列式戦略はプレイヤーの利得の間に一方的に線形関係式を課す記憶1戦略のクラスである。これまでに囚人のジレンマゲームや公共財ゲームのようないくつかのゲームにおいてはゼロ行列式戦略が発見されてきた一方で、ジャンケンなどゼロ行列式戦略が存在しないゲームも知られており、ゼロ行列式戦略の存在条件は長い間未知であった。本研究ではゼロ行列式戦略が存在するための成分ゲームの必要十分条件を特定した。この条件は、利得の線形結合の累積値を一方的に調整できる2つの行動の存在という形で理解できる。また、2人対称ゲームにおいて、一般化ジャンケンサイクルが存在しないゲームには必ず2人の利得を一方的に等しくする(負けない)ゼロ行列式戦略が存在することも示した。 また、申請者は昨年度ゼロ行列式戦略を記憶n戦略クラスに拡張したが、この記憶nゼロ行列式戦略を用いると通常の記憶1ゼロ行列式戦略から任意のバイアスアンサンブルでの平均利得の間に一方的に線形関係式を課す戦略を構成できることを示した。これは、バイアスとしてあるプレイヤーにとって不利な状況に大きな重みを与えてやることで、通常のゼロ行列式戦略を強くできる可能性を意味する。繰り返し囚人のジレンマゲームにおいて記憶nゼロ行列式戦略を具体的に構成する方法も示した。また、変形ゼロ行列式戦略と組み合わせて使う方法についても示した。 その他、次の3つの成果も得られた。1. 繰り返し2人対称ゲームにおけるしっぺ返し戦略のゼロ行列式戦略に基づく解釈。2. 繰り返し囚人のジレンマゲームにおける決定論的記憶2戦略のなす相互強化学習均衡の解析。3. N人完全対称ゲームの1クラス(搾取不可能ゲーム)における負けないゼロ行列式戦略と負けない模倣戦略の存在の証明。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は繰り返しゲームにおけるゼロ行列式戦略の性質の理解と利得制御能力の拡張に注力した。結果として、(少なくとも申請者の中では)長い間問題となっていたゼロ行列式戦略の存在条件を特定することができた。これにより、「1人のプレイヤーによる利得の一方的な制御」というゼロ行列式戦略の直感に反する性質はある意味で自明なものになったと言える。また、条件付き平均利得を制御できるようにゼロ行列式戦略を拡張することにも成功した。これは、既存のゼロ行列式戦略を強化する目的にも使うことができ、今後の展開が期待される。 さらに、今年度は新しく、繰り返しゲームにおける模倣戦略の性質をゼロ行列式戦略の立場から理解する、という方向へと踏み出すことができた。模倣がうまくいく条件を特定することは、複製者を罰する問題へと話をつなげられるかもしれないので、引き続き研究を行いたい。
|
今後の研究の推進方策 |
まず、N人完全対称ゲームにおいて負けない模倣戦略が存在するゲームの条件は現段階では明確でないため、調査を行いたい。特に、負けない模倣戦略の存在と負けないゼロ行列式戦略の存在には何らかの関係が示唆されるので、これらの直接的な関係の有無を調べたい。また、模倣と強化学習を繋ぐような戦略クラスの提案もできたら面白い。さらに、今年度までで対象としてきたような対戦相手の模倣ではなく、共通の敵と対戦する場合の味方の模倣の性質の解析なども行いたい。
|
次年度使用額が生じた理由 |
今年度は新たに民間の財団からの助成金を受け入れたため、資金に多少の余裕が生じた。今年度学術誌に掲載された5報の論文のうち3報はオープンアクセス化した(フルオープンアクセス誌も含む)ので、この助成金がなければむしろ資金は足りなかったと言えるだろう。また、指導学生の研究が思い通りに進んでおらず、旅費が未使用となったことも繰越額が生じた理由の一つである。2023年度は指導学生初の大学院進学者が現れたため、国内外での発表を行えたら良い。研究室の計算機も更新する予定である。
|