研究課題/領域番号 |
21K13667
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分10010:社会心理学関連
|
研究機関 | 東京大学 |
研究代表者 |
小倉 有紀子 東京大学, 大学院情報理工学系研究科, 特任研究員 (00794728)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2021年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | producer-scrounger game / interdependency / social learning / 状態空間モデリング / fMRI / 探索-利用 / リスク / 意思決定 |
研究開始時の研究の概要 |
社会情報の利用によって個人や集団が利益を得るには、個人経験利用戦略と社会情報利用戦略のいずれかに頼る「固執型メタ戦略」ではなく、両者を動的に使い分ける「柔軟型メタ戦略」を用いる必要がある。しかしながら、メタ戦略はリスク寛容度という生物学的要因によって制限されている可能性がある。本研究ではメタ戦略使用の神経基盤を調べることで、 リスク寛容度による生物学的拘束がどれだけ強いかを明らかにする。
|
研究実績の概要 |
我々が現代社会で生活する上で、自分の経験だけでなく社会的な情報を利用することは欠かせない要素となっているが、社会情報さえ利用すれば利益がもたらされるとは限らない。社会情報利用によって個人や集団が利益を得るには、 「時間変化に応じて、個人経験利用戦略と社会情報利用戦略とを動的に切り替えていく」 というメタ戦略を用いる必要があると考えられる。しかしながら現実の人間は、必ずしも最適なメタ戦略を使えていない可能性がある。これは人間の個人差によるものなのか、それとも環境構造の側の要因が大きいのかを検討するのが本研究の目的である。 2021年度は予備的検討として、相互依存的なゲーム構造の下で強化学習エージェントが繰り返しゲームをプレイした場合に、集団がどのような挙動を示すかをシミュレーションした。マルチエージェントが強化学習により、個人経験利用と社会情報利用の状態行動価値(Q値)をアップデートしていくモデルを検討した。更新則として、一般的にヒトや動物で用いられていると考えられる(1)Rescorla-Wagner則 と、より直近の意思決定に対する重み付けが大きい(2)Roth-Erev則の2種類を検討した。結果、Rescorla-Wagner則の場合は全エージェントの戦術選択確率が0.5前後付近に留まるのに対し、Roth-Erev則の場合は個人経験利用者と社会情報利用者への2極分化が生じ、パラメータ設定次第でNash均衡に至ることが分かった。つまり、個体が用いる価値更新則が異なると、集団の挙動が大きく異なりうるといえる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2021年度中に被験者実験を行って、現実のヒトが相互依存場面でどのような学習則を用いるか、また学習則を時間経過とともにスイッチさせるのかを検討する予定であったが、実際にはエージェントシミュレーションを実装するに留まってしまった。次年度中に行動実験、可能であれば脳機能画像計測まで進めていきたい。
|
今後の研究の推進方策 |
第一に、2021年度に行ったエージェントシミュレーションでは、環境としては相互依存構造があるにもかかわらず、モデルは相互依存性を含んでいないという問題点がある。他者の挙動を考慮するようなモデルを検討すべきだが、その際特に、他者の(表に出た)行動のみを組み込むべきか、それとも他者の内部状態を推定するようなモデルにすべきか、を検討していく必要がある。また、時系列に従ってエージェントの内部状態が変化する可能性を十分に検討できていない。特に、学習則が途中で変化する可能性も今後検討したい。 第二に、実際のヒトで被験者実験を行い、エージェントシミュレーション結果と比較した上でモデルの再検討、より適切なモデルの選択を行いたい。
|