研究課題/領域番号 |
24710163
|
研究種目 |
若手研究(B)
|
研究機関 | 東京工業大学 |
研究代表者 |
山田 隆志 東京工業大学, 総合理工学研究科(研究院), 助教 (90401570)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | 行動ゲーム理論 / マルチエージェントアプローチ / 社会・経済システム |
研究概要 |
平成24年度は、一般非零和行動ゲーム "do-it-yourself lottery" (Barrow, 2008) におけるプレイヤの限定合理性と学習を、主に理論と計算機実験によって分析した。 まず、プレイヤが他者の出した数字を知ることが出来ない状況下で、強化学習を用いてゲームをプレイするときの個人並びに系全体の挙動は以下の通りである: (1) 理論面では均衡点が混合戦略均衡に収束するかは学習モデルによって異なるだけでなく、純戦略を選択するパラメータの値が大きくなると特定の戦略のみが選ばれるようになる、(2) 計算機実験では出された数字の分布と勝った数字の分布が理論面のそれとは異なる、(3) 純戦略を選択するパラメータの値が大きくなると経路依存性のために勝者と敗者がすぐに固定される。 次に、プレイヤが他者の出した数字を知ることが出来ない状況下で、信念学習を用いてゲームをプレイするときの個人並びに系全体の挙動は以下の通りである: (1) 計算機実験で出された数字の分布と勝った数字の分布が混合戦略均衡に収束しない。これは理論面が予想している信念学習の収束不可能性の確認である、(2) ゲームのパターン(どんな数字がよく選ばれ、どんな数字が勝ち数字となるか)は信念学習が持つ二種類のパラメータに依存する。 最後に、プレイヤが他者の出した数字を知ることが出来ない状況下ではあるが、プレイヤが "rule learning" (Stahl, 2000) を用いてゲームをプレイするときの個人と系全体の挙動は以下の通りである: (1) 出された数字の分布と勝った数字の分布が混合戦略均衡に収束しない、(2) 純戦略を選択するパラメータの値が大きくなると勝者と敗者がすぐに固定される、(3) 勝った数字の模倣をするプレイヤが三人ゲームでは見られるのに対し、四人ゲームでは見られなかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
理論、計算機実験については行動経済学や人工知能で用いられる学習モデルの主要なものをほぼ全て分析・比較することができた。これらの成果は国際会議 AESCS 2012 や WCSS 2012 で発表され、どちらもその後 Springer から出版される書籍に収録される予定である。 一方で、被験者実験を行うためのソフトウェア作りに時間がかかり、平成24年度には満足な実験を行うことが出来なかった。これは平成25年度の課題でもあるが、研究実績の概要欄にもあるように、理論・計算機実験の一部を前倒しで行ったため平成25年度に達成することは十分可能である。
|
今後の研究の推進方策 |
平成25年度では "do-it-yourself lottery" のうち、理論・計算機実験だけでなく、被験者実験に重きを置いてプレイヤの行動と意思決定の解明を行いたい。特に、理論・計算機実験で分析した三人や四人という一般ゲームではあるが比較的系の規模が小さいゲームに焦点を当てて研究を行う。 具体的には、(1) コンピュータ・被験者実験、(2) 実験結果の分析と比較、(3) 学習モデルの構築と提唱、である。このうち、(1) は (a) エージェント vs. エージェントのコンピュータ実験、(b) 被験者 vs. 被験者の実験室実験、(c) 被験者 vs. エージェントの実験室実験、の三種類から成り、それぞれプレイヤとしてのエージェントや被験者がどのようにゲームをプレイし学習するかのデータを収集する。(2) は (1) の実験で得られた行動・学習データを分析する。コンピュータ実験についてはモデル間の相違だけでなく、プレイヤとゲーム全体の挙動が均衡に向かうのかを調べる。被験者実験については、被験者の行動パターンが従来の学習モデルで記述できるかを検証する。そして (3) は (2) の分析結果から、三人あるいは四人の系でのエージェントの学習モデルを構築・提唱する。従来の学習モデルで記述出来る場合はパラメータの値が他の社会・経済系と同じであるかを調べる。そうでない場合は系に相応しい新しい学習モデルを構築する。モデルの構築が難しい場合は機械学習などを用いてパターンの発見をする。学習モデル・行動パターンは再びコンピュータ実験、被験者実験へ組み込まれて精緻化を図る。
|
次年度の研究費の使用計画 |
「現在までの達成度」や「今後の研究の推進方策」にもあるように、平成24年度は謝金の支払いを伴うような被験者実験を実質的に行えなかったため、それらが未使用のまま残された。これらの研究費は多くがソフトウェア開発や被験者実験のための謝金に充てられる予定である。また、必要に応じて成果発表と情報収集をするための旅費に一部はなる。
|