研究課題/領域番号 |
22KJ1414
|
補助金の研究課題番号 |
21J01393 (2021-2022)
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 (2023) 補助金 (2021-2022) |
応募区分 | 国内 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 総合研究大学院大学 |
研究代表者 |
藤本 悠雅 総合研究大学院大学, 先導科学研究科, 特別研究員(PD)
|
研究期間 (年度) |
2023-03-08 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ゲーム理論 / 間接互恵 / マルチエージェント学習 / 数理生物学 / 複雑系 / 繰り返しゲーム / 進化 / 学習 / マルチエージェント / 協力・搾取 |
研究開始時の研究の概要 |
本研究は、個人がメモリを持つ、すなわち過去に自分や相手がとった行動に応じて次の行動選択を変えられる状況を想定する。そして、二人の個人が自身の戦略を学習することによってどのような関係を構築するかを研究する。本年度は、メモリありの学習を計算機科学や人工知能分野で研究されているアルゴリズム(replicator dynamics, gradient ascent, Q-learningなど)に応用することを考える。そして、そしてメモリありの学習が、実際の問題(ゼロサムゲームでのNash均衡への収束の困難)を解決できるかを検証する。
|
研究実績の概要 |
申請者の研究はゲーム理論によって社会構造を明らかにするものである。受入研究者との新しいテーマとして、大規模な社会における協力機構を議論する研究を行った。この協力機構は間接互恵と呼ばれ、個人は評判を通じて相手に協力するかどうかを選択する。そこでは、どのような行動・評価ルールに基づけば集団内で協力を保つことができるか、さらに他者の侵入を防げるかが主要な問題になっている。この問題は、ある個人の評判を全員で共有できるpublicな状況においては解かれているが、全員が独立に保持するprivateな状況においてはより深刻であり未解決である。このような問題に対し、我々はprivateな状況を取り扱うための数理的な枠組みを構築し、一部の評価ルールが他者の侵入に対して安定的に協力を達成できることを示した。また、個人間でコンセンサスを取れる評価ルールを用いることでこの安定的な協力が達成できることを明らかにした。
また、元々想定していた研究内容として、最適化を行う主体が複数いる状況下での学習過程を議論する研究を行った。これは計算機科学ではマルチエージェント学習と呼ばれており、個人が自身の行動選択の戦略を最適化しても、全体が最適な戦略をとる(ナッシュ均衡)のを実現するのが難しい場合がある。特に、現実の主体は過去の行動の情報を参照して次の自身の行動の選択を変えることが可能であり、そのときの主体の学習過程は複雑になる。このような複雑な学習過程において、ナッシュ均衡が達成できるかは未解決の問題であった。我々はそのような複雑な学習過程を理論的に分析する方法を構築し、情報の参照が対称な主体間ではナッシュ均衡から発散し、情報の非対称な主体間では逆に収束する挙動があることを理論・実験的に示した。
|