研究概要 |
本研究では,プレイヤにとって複数均衡をもつゲーム/メカニズムの実験的検証を通じて,人間が,ゲーム/メカニズムの構造や相手の行動を観察し,自分および相手の行動などの情報交換の影響を比較し,その意思決定過程を記述する適応的学習理論を構築する. とくに今年度は研究計画の通り,ゲーム理論的構造は等しいが,利得ドメインの異なる3つのスタッグハントゲームに関する被験者実験を実施し,その結果を世界最大の実験経済学の学会であるESA Meetingにて発表した.本発表において,「損失回避(Loss avoidance)」の概念を「確定的な損失回避(certain loss avoidance)」および「不確定な損失回避(possible loss avoidance)」の2つに精緻化することで,各利得ドメインに対する被験者の振る舞いの変化を説明することに成功した. さらに,適応的学習理論の基礎的検討として,プレイヤが仕入価格と販売価格を選択する独占的仲介市場における価格形成に対する強化学習の再現性を吟味し,その結果をAESCS-2005で発表した.本発表では,強化学習がランダム戦略や最適反応戦略よりうまく被験者実験の結果を再現することを明らかにした.しかし,被験者実験でもっとも顕著に観察された価格付け戦略(2段階探索)を再現することはできなかった.一方で,この2段階探索を組み込むことで,強化学習の記述力が改善することを示した.
|