研究課題/領域番号 |
24710163
|
研究機関 | 東京工業大学 |
研究代表者 |
山田 隆志 東京工業大学, 総合理工学研究科(研究院), 助教 (90401570)
|
キーワード | マルチエージェント実験経済学 / 行動ゲーム / 学習 |
研究概要 |
平成25年度の実績は以下の二点である: (1) 実験室実験では "Do-It-Yourself Lottery" において、プレイヤ数が 3 ないし 4 のとき、かつ戦略数が 3 ないし 4 であるときの実験を行い、プレイヤの行動と学習にかんするデータを収集し分析した。ここでは プレイヤにはプレイヤ数あるいは戦略数のいずれかが異なるゲームを二種類プレイしてもらうことにより、ゲーム内での学習とゲーム間での学習がそれぞれ観測されるかが問題となってくる。実験結果を分析したところ、(a) プレイヤは "Do-It-Yourself Lottery" で求められる混合戦略均衡をプレイできない、(b) 学習モデル Experienced Weighed Attraction (Camerer and Ho, 1999) によるパラメータ推定ではプレイヤは他者のプレイをあまり意識していない、(c) ゲーム間学習の有無は実験設定とグループによって異なる、ことが得られた。 (2) 計算機実験では、プレイヤがゲームの結果から相手の行動を不完全に推測するような学習・行動モデル Quasi Fictitious Play (QFP) を考え、相手の行動を推測しない学習・行動モデル Adaptive Learning (AL) との比較を行った。その結果、(a) 理論上では QFP は AL よりも一番小さい数字を選ぶ確率が高い、(b) 戦略を選択するパラメータの値が低いあるいは QFP を用いるプレイヤがグループ内に一人しかいない場合はそのプレイヤが勝つ回数が増える、(c) 戦略を選択するパラメータが高いあるいは QFP を用いるプレイヤがグループ内に複数いる場合はある AL を用いるプレイヤがむしろ勝つ回数が増えることが確認された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
一通りの被験者実験が完了しているために、そこで得られたプレイヤの行動・学習データがこれまでに提唱されている学習モデルによって説明可能であるかの確認ができていることと、プレイヤがゲーム結果から他者の行動を推測するような学習モデルを構築して従来の学習モデルとの比較ができているのがその理由である。
|
今後の研究の推進方策 |
(1) 平成25年度に得られた実験データの分析を引き続き行い、従来の学習モデルと構築したモデルによってプレイヤの行動と学習がそれらによって説明できるかを調べ、適当な学習モデルと推定されたパラメータを用いて計算機実験を行う。これにより、"Do-It-Yourself Lottery" が(ゲームの結果がプレイヤ数や戦略数に依存するのかなど)社会・経済システムとしてどのような性質をもつのかの解明も可能になる。(2) 同時に、人間プレイヤと(適当な学習モデルと推定されたパラメータによって表現される)コンピュータプレイヤが共存するような環境下での実験室実験を必要に応じて行い、人間プレイヤのみの実験や計算機実験との結果の比較を行いたい。
|
次年度の研究費の使用計画 |
平成25年度はフランスにて在外研究を行っていたため、日本での研究活動が十分に行えなかったのが理由である。 平成26年度の使用計画は以下の通りである: 消耗品費 150 千円 (関連書籍 100 千円、データ保存メディア 50 千円)、国内旅費(成果発表ならびに情報収集) 100 千円 (計測自動制御学会 システム・情報部門 社会システム部会研究会 @ 小樽、宮古島)、外国旅費 (成果発表ならびに情報収集) 400 千円 (IEEE COMPSAC 2014 in Sweden)、謝金 600 千円 (被験者実験のため)、その他 100 千円 (論文別刷り代)
|