研究概要 |
繰り返し囚人のジレンマケ-ムにおいて、相手の戦略のアルゴリズムを予測して自分の次の手を決定するプレイヤー同志のシミュレーションを行った。具体的なモデルとして相手のアルゴリズムを再帰的ニューテルネットで学習し、その学習した結果を基に次の最適な自分の手を探索させた。 研究結果として、1)相手がこちらを予測できない固定戦略の場合、相手のアルゴリズムを正しく予測することが可能であることを示した。2)お互いに相手の予測するプレイヤー同志のゲームでは、一見時間的にランダムな系列の手が指される。ここではそのランダムさの説明として、相手のモデル空間のランドスケープの凸凹度として捉えられるのではないか、という解析を行った。その結果ランドスケープの凸凹度がゲームの進行とともに複雑になり、最終的にそれが失われる様子が観測された。最終的な局面においては、裏切り合いが頻繁に観測される。3)相手のモデルを予測する際に不確かさを導入し、その不確かさによってゲームの進行がどのように変化するかを解析した。この際学習法による任意性を除くために可能なモデルの数を限定し、総調べを行った。その結果、いくつかの相互協調にいたる道筋が明らかにされた。 これらの結果は、ヨーロッパ第4回人工生命国際会議(ECAL4(England,Brighton,1997年7月))、日本物理学会(神戸、1997年10月)、および京都大学基礎物理学研究所の研究会「認知・行動の基底としての力学と論理」(京都、1997年12月)において。それぞれ発表された。現在この結果を学術雑誌(Physica D)に投稿中である。
|