研究課題/領域番号 |
20K19884
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 山口大学 |
研究代表者 |
上田 仁彦 山口大学, 大学院創成科学研究科, 講師 (00826571)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 繰り返しゲーム / ゼロ行列式戦略 / 負けない戦略 / 模倣戦略 / しっぺ返し戦略 / 相互強化学習 / ポテンシャルゲーム / 社会的ジレンマ / ゲーム理論 / 強化学習 / 囚人のジレンマ / 予測市場 / 共有知識 / 効率的市場仮説 / 情報市場 / market scoring rule / 著作権 / ソーシャルコンピューティング |
研究開始時の研究の概要 |
古典的なミクロ経済学は市場における物々交換に基づいて財の価格と最適な配分が決まるメカニズムを扱う。しかしながら、近年の情報技術の発展により、物々交換が成り立たずコストなしに複製できるような、いわゆる情報財が現れてきている。このような情報財の価値が自動的に決まるような市場メカニズムはまだ存在せず、違法な複製による著作権侵害のような様々な問題を引き起こしている。本研究では、情報に対する市場理論を構築することを遠くに見据えて、情報科学の側から情報の経済学を捉え直し、情報の価値に対する数理的理解の深化と体系化を目指す。
|
研究実績の概要 |
繰り返しゲームにおけるゼロ行列式戦略はプレイヤーの利得の間に一方的に線形関係式を課す記憶1戦略のクラスである。これまでに囚人のジレンマゲームや公共財ゲームのようないくつかのゲームにおいてはゼロ行列式戦略が発見されてきた一方で、ジャンケンなどゼロ行列式戦略が存在しないゲームも知られており、ゼロ行列式戦略の存在条件は長い間未知であった。本研究ではゼロ行列式戦略が存在するための成分ゲームの必要十分条件を特定した。この条件は、利得の線形結合の累積値を一方的に調整できる2つの行動の存在という形で理解できる。また、2人対称ゲームにおいて、一般化ジャンケンサイクルが存在しないゲームには必ず2人の利得を一方的に等しくする(負けない)ゼロ行列式戦略が存在することも示した。 また、申請者は昨年度ゼロ行列式戦略を記憶n戦略クラスに拡張したが、この記憶nゼロ行列式戦略を用いると通常の記憶1ゼロ行列式戦略から任意のバイアスアンサンブルでの平均利得の間に一方的に線形関係式を課す戦略を構成できることを示した。これは、バイアスとしてあるプレイヤーにとって不利な状況に大きな重みを与えてやることで、通常のゼロ行列式戦略を強くできる可能性を意味する。繰り返し囚人のジレンマゲームにおいて記憶nゼロ行列式戦略を具体的に構成する方法も示した。また、変形ゼロ行列式戦略と組み合わせて使う方法についても示した。 その他、次の3つの成果も得られた。1. 繰り返し2人対称ゲームにおけるしっぺ返し戦略のゼロ行列式戦略に基づく解釈。2. 繰り返し囚人のジレンマゲームにおける決定論的記憶2戦略のなす相互強化学習均衡の解析。3. N人完全対称ゲームの1クラス(搾取不可能ゲーム)における負けないゼロ行列式戦略と負けない模倣戦略の存在の証明。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は繰り返しゲームにおけるゼロ行列式戦略の性質の理解と利得制御能力の拡張に注力した。結果として、(少なくとも申請者の中では)長い間問題となっていたゼロ行列式戦略の存在条件を特定することができた。これにより、「1人のプレイヤーによる利得の一方的な制御」というゼロ行列式戦略の直感に反する性質はある意味で自明なものになったと言える。また、条件付き平均利得を制御できるようにゼロ行列式戦略を拡張することにも成功した。これは、既存のゼロ行列式戦略を強化する目的にも使うことができ、今後の展開が期待される。 さらに、今年度は新しく、繰り返しゲームにおける模倣戦略の性質をゼロ行列式戦略の立場から理解する、という方向へと踏み出すことができた。模倣がうまくいく条件を特定することは、複製者を罰する問題へと話をつなげられるかもしれないので、引き続き研究を行いたい。
|
今後の研究の推進方策 |
まず、N人完全対称ゲームにおいて負けない模倣戦略が存在するゲームの条件は現段階では明確でないため、調査を行いたい。特に、負けない模倣戦略の存在と負けないゼロ行列式戦略の存在には何らかの関係が示唆されるので、これらの直接的な関係の有無を調べたい。また、模倣と強化学習を繋ぐような戦略クラスの提案もできたら面白い。さらに、今年度までで対象としてきたような対戦相手の模倣ではなく、共通の敵と対戦する場合の味方の模倣の性質の解析なども行いたい。
|