Project/Area Number |
14730007
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
経済理論
|
Research Institution | Hitotsubashi University |
Principal Investigator |
野口 雄一 一橋大, 経済学研究科(研究院), 講師 (60323903)
|
Project Period (FY) |
2002 – 2004
|
Project Status |
Completed (Fiscal Year 2003)
|
Budget Amount *help |
¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 2003: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2002: ¥600,000 (Direct Cost: ¥600,000)
|
Keywords | 精緻な学習 / conditional smooth nonmyopic play / 仮説検定学習 / 効率的ナッシュ均衡 / 繰り返しゲーム / フォーク定理 |
Research Abstract |
研究計画調書で書いた研究目的のうち、二つが達成された。第一に、精緻な学習能力を持つプレイヤーが長期的な利益を目的としているときにどの程度実際の長期的利得が得られるのかを考察し、敵対する相手が加算個の範囲内でどんな規則性を持つ戦略を使用しても、プレーヤーがconditional smooth nonmyopic playという戦略を取れば相手の真の戦略を知っている場合と同じ長期利得を学習して得ることができるという結果を得ることができた。 第二に、精緻な学習能力を持ったプレーヤー同士がゲームを繰り返しプレイする場合の動学を詳しく分析した。具体的にはFoster and Youngが考案した仮説検定に基ずく学習ルールを広範囲な相手の戦略を学習可能にする形に拡張した。そして、ある意味でナッシュ均衡の集合に収束することを示すことに成功した。しかし、どのナッシュ均衡に収束するかという問題が残るため、上記の学習ルールをさらに改訂して、自分が得られると予想される利得に依存して仮説検定をする確率が変わるようにした。これにより、ユニークな効率的なナッシュ均衡利得をプレーヤー達は学習してプレイするようになることを示すことに成功した。言い換えれば、同じパレート効率的な利得をもたらすナッシュ均衡の集合に収束するという、より強い結果を得たことになる特筆すべき点はこの学習ルールは、近視眼的な場合でも非近視眼的な揚合でも上記の結果をもたらすことである特に今までの学習理論ではプレーヤー達がナイーブで近視眼的な場合に集中して研究されてきたが、この研究では、プレーヤー達が精級で非近視眼的な場合でも効率的なナッシュ均衡に収束する結果を得た。この結果は、繰り返しゲームのフォーク定理で使用されているタイプの均衡戦略でも学習可能であることを示している点で注目すべき結果である。
|