研究課題/領域番号 |
21K04117
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分21040:制御およびシステム工学関連
|
研究機関 | 東京工業大学 |
研究代表者 |
早川 朋久 東京工業大学, 工学院, 准教授 (30432008)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 非協調システム / インセンティブ設計 / メカニズムデザイン / ゲーム理論 / パレート改善 / ナッジ / インセンティブ / 情報の非対称性 / 非協調・非協力システム / ミクロ経済学 |
研究開始時の研究の概要 |
本提案研究では,人間の戦略的行動選択を動的システムとして書き下し,ネットワーク化されている社会・経済的システム全体の時間的進展を制御工学・力学系の観点から解析していく.特に,ゲーム理論的均衡構造と情報交換構造の階層化を端緒にして,ネットワーク化された現代の急速なデジタル化社会を見据え,個別の主体の利得最大化問題と,総体(社会)の利益(社会的余剰)の最大化との関係を定量化し,合理的・非合理的選択,平衡状態やその分岐,安定性,フィードバック結合等を解析していくことで,静学的ゲームでは見出せない現象を探り,人間と社会の行動原理を解明し制御していく基礎論を構築していく.
|
研究実績の概要 |
人間の社会的・経済的活動を制御理論の枠組みを用いて定式化を行っている.社会状態の改善にはインセンティブ設計を適切に設定することが重要であるが,そのインセンティブの財源とのバランスを取り,実行可能なメカニズムを構築することが運用上必要である.このメカニズムを用いて,戦略空間内で2主体の最適戦略集合を定めたときに,過渡軌道が収束せず周期解が現れる/現れないための条件を求め,周期解は孤立解か稠密か,周期解の中心には平衡解があるのか,等の解析を行った.また,ゲーム理論的枠組みを状態方程式を用いて定式化し,レプリケータ力学系などに加えて,これまで動的システムとしては考慮されてこなかった人間-情報系の代表的モデルを動的にモデル化し解析を進めている.
さらに上記で構築したメカニズムを用いて,各主体の最適戦略集合の共通点が孤立点でない場合にその点はNash均衡解となるか検討を行った.協調・非協調関係で,協調行動は自己の利益最大化を犠牲にして,他の「何か」を最大化することを他の主体と共同で行うことと捉えられるが,この際の両者の利得関数はどのように特徴付けられるか,他者の利得関数の情報を持っているか否か,その情報保持関係に対称性がある場合と非対称な場合で特徴付けがどのように変わるかの考察を行った.技術的には,ポテンシャルゲームとパレート改善の不一致性を同定し,共通のポテンシャルによって規定されるゲーム関係よりも広いクラスのゲームを適切に設定することによって,社会全体の厚生を高めるためのインセンティブ設計に成功している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本提案研究の中間年度にあたり,初年度の研究結果を拡張して,人間の社会的・経済的活動を制御理論の枠組みを用いて定式化しインセンティブ設計論を構築するという目標に向けて,解析を進めることができている.特に,インセンティブの適切な設定には,財源とのバランスを取り,実行可能なメカニズムを構築することが重要であるが,これまでのインセンティブ設計論ではあまり考慮されてこなかった予算制約やパレート改善の手法など,新たなパラダイムを提案しながら理論研究を進めることができている.
これらの初期的成果は複数の学術誌・国際会議において発表・発表準備を行っており,順調に成果発表が行われていると考えている.
|
今後の研究の推進方策 |
これまでのメカニズムデザインでは,各エージェントの利得関数はスカラー値を取るとするものが主体となっているが,2023年度の研究では利得関数がベクトル値を取るものとして解析とインセンティブ設計を行っていく.このとき,Nash均衡集合の定義から精査して設定していく必要があるが,概念的・実践的に妥当なNash均衡集合と疑似勾配ベクトル場をベクトル値利得関数を扱う場合に定義し,解析を行っていく.されにインセンティブ設計の枠組みを構築していくが,インセンティブとしてまず金銭を想定することが自然であるため,ベクトル値利得関数の一部の要素にのみ影響を与えうるインセンティブ構造となる.このとき,どのような条件が成り立てば,社会状態がパレート改善可能であるか,その条件式を導出していく.また,非協調システムが不確かさを包含する場合や,各エージェントの利得がその時々の評価感覚によって不確かなゆらぎが生じる場合,インセンティブ設計者としてのインセンティブ設計には注意が要求される.このような不確かさを内包する非協調システムにおいて,メカニズムデザインに隠れ状態 (hidden state) のような要素を加えることによってダイナミックなパラメータ設定を可能にする枠組みを与え,社会全体の状態をセンシングしながら動的にパラメータを変更できるインセンティブ設計を構築していくことを目指す.
2023年度は本提案研究の最終年にあたるため,これまでの研究の総まとめを行い,順次成果発表に繋げていく予定である.
|