Lowest Unique Integer Game の計算機実験では、プレイヤーが取り得るあらゆる学習モデルを取り上げ、そのパラメータの組み合わせが等間隔になるようにエージェントを構成させるようなものに改めた。その結果、1 を出し続けるエージェントは引き続きある程度の勝率は誇るが、一変数強化学習モデルの方がより良い成績を収めることがわかった。さらに、2 を出し続けるエージェントは三人ゲームでは全く成績が良くなかったのに対し、四人ゲームでは 1 を出し続けるエージェントや一変数強化学習モデルほど成績は良くないがある程度の勝率を上げるのがわかった。
Swedish Lottery の計算機実験では、プレイヤーが過去の参加者数、過去の勝ち数字、キャリーオーバーの総額などを参考にして、くじを購入するかを決定するモデルを構築した。これをもとにプレイヤー数、戦略数、勝ち数字の決め方、公開される情報の量を変えてプレイヤーがどのようなときに戦略的にくじを購入したり見送ったりするのかの条件を探った。
オンライン広告オークションの分析では、まず実数値遺伝的アルゴリズム(RCGA)によって競合他社の入札分布を推定した。次に、競合他社の入札分布がそれに従うという仮定の下で、当該 Demand Side Protocol の入札戦略を整数計画法と RCGA の組み合わせによって決定するものを導入し、計算機実験を行った。具体的には、ある時間帯にあるウェブサイトを訪れる人数をデータから推定された値をもとに指数分布で与え、その人数とその時間帯の残り時間、それにその時間帯に与えられた予算の残額に基づいてどの価格帯に入札するのかを決定させている。入札の結果は再び RCGA によって競合他社の入札分布の更新に利用する。このような計算機実験を行い、実データでの入札成績と比較した。
|