研究課題/領域番号 |
09640454
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
物性一般(含基礎論)
|
研究機関 | 東京大学 |
研究代表者 |
池上 高志 東京大学, 大学院・総合文化研究科, 助教授 (10211715)
|
研究分担者 |
泰地 真弘人 東京大学, 統計数理研究所・統計計算開発センター, 助教授 (10242025)
|
研究期間 (年度) |
1997 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
1998年度: 1,100千円 (直接経費: 1,100千円)
1997年度: 2,500千円 (直接経費: 2,500千円)
|
キーワード | ゲーム / 内部モデル / 協調性 / 囚人のジレンマゲーム / 神経ネットワーク / リカレント・ニューラルネット |
研究概要 |
本研究の目的は以上でみるように動力学的な面を追求する新しいモデルを提案し、そのモデル・シミュレーションを通じて、プレイヤーの合理性や規範の生成を論じようというものであった。2年間の研究期間を通じて次のような成果をあげることができた。 1) ゲームのプレイヤーが相手のプレイヤーのモデルをつくり、そのモデルをもとに将来を予測し最適化しながらゲームをする状況を計算機の中でシミュレーションすることができた。特に繰り返し囚人のジレンマゲームを例に取り、研究目的にあげたように動的認識ネットワークを使った相手のモデルの生成を行った。 2) 探索空間の複雑さはモデルの非決定性と深く関係がある。この不定性を明示的に扱うことで、不定性のもとで相手のモデルをもとに手を決めるプレイヤーのゲームの特徴つけを行った。相互協調の意味での規範は、このモデルの不定性とともに出現する。 3) 囚人のジレンマゲームの構造は、得点をパラメター化して揺さぶることができる。この揺さぶり実験の結果、(a)ある領域で軌道が分岐が著しく多い。(b)ある領域で協調的アトラクターと非協調的アトラクターが混在している。(c)分岐が頻繁に生じても協調的なアトラクターが多く出現するわけではない。ということが調べられた。 4) 以上の結果は囚人のジレンマゲームに関するものであったが、これを空間の入ったゲームに拡張することができた。囚人のジレンマゲームでは協調性を保つ時に、相手のモデルが固定したしっぺ返し戦略という有限オートマトン戦略であった。しかしこの新しいゲームでは、非有限オートマトン的なものを含んだ複数のモデルを相手に対して生成することで「動的に」協調性が保ちうることが示された。
|