1997 Fiscal Year Annual Research Report

ゲームにおける内部モデルの生成とダイナミクスの研究

Research Project

Project/Area Number	09640454
Research Category	Grant-in-Aid for Scientific Research (C)
Research Institution	The University of Tokyo
Principal Investigator	池上高志東京大学, 大学院・総合文化研究科, 助教授 (10211715)
Co-Investigator(Kenkyū-buntansha)	泰地真弘人文部省統計数理研究所, 助教授 (10242025)
Keywords	ゲーム / リカレント・ニューラルネット / 囚人のジレンマゲーム / 内部モデル
Research Abstract	繰り返し囚人のジレンマケ-ムにおいて、相手の戦略のアルゴリズムを予測して自分の次の手を決定するプレイヤー同志のシミュレーションを行った。具体的なモデルとして相手のアルゴリズムを再帰的ニューテルネットで学習し、その学習した結果を基に次の最適な自分の手を探索させた。研究結果として、1)相手がこちらを予測できない固定戦略の場合、相手のアルゴリズムを正しく予測することが可能であることを示した。2)お互いに相手の予測するプレイヤー同志のゲームでは、一見時間的にランダムな系列の手が指される。ここではそのランダムさの説明として、相手のモデル空間のランドスケープの凸凹度として捉えられるのではないか、という解析を行った。その結果ランドスケープの凸凹度がゲームの進行とともに複雑になり、最終的にそれが失われる様子が観測された。最終的な局面においては、裏切り合いが頻繁に観測される。3)相手のモデルを予測する際に不確かさを導入し、その不確かさによってゲームの進行がどのように変化するかを解析した。この際学習法による任意性を除くために可能なモデルの数を限定し、総調べを行った。その結果、いくつかの相互協調にいたる道筋が明らかにされた。これらの結果は、ヨーロッパ第4回人工生命国際会議(ECAL4(England,Brighton,1997年7月))、日本物理学会(神戸、1997年10月)、および京都大学基礎物理学研究所の研究会「認知・行動の基底としての力学と論理」(京都、1997年12月)において。それぞれ発表された。現在この結果を学術雑誌(Physica D)に投稿中である。