2011 Fiscal Year Annual Research Report
Project/Area Number |
21500031
|
Research Institution | The University of Tokyo |
Principal Investigator |
金田 康正 東京大学, 情報基盤センター, 教授 (90115551)
|
Keywords | 祖結合並列計算 / 将棋プレーヤー / 集団学習 / 評価関数 / 並列化 / Bagging / 乱数合議 / アルゴリズム |
Research Abstract |
近年疎結合並列環境を用いた将棋プレーヤーの判断決定の方法として合議が注目されている。合議とは複数の将棋プレーヤーの判断を統合することによって最終的な指し手を決定する枠組みのことである。合議は比較的単純な実装方法で並列化を実現でき、多数決により判断ミスの少ない強い将棋プレーヤーを生成できるという利点がある。小幡らは将棋プログラムBonanzaに乱数合議と呼ばれる手法を用いることによって、従来のBonanzaに有意に勝ち越すプレーヤーを生成することに成功した(http://homepage1.nifty.com/ta_ito/ito-lab/gougi/gougi.html)。なお乱数合議とは、将棋プレーヤーが持つ評価関数の評価値を乱数により変化させることで複数の判断を生成し、それらを用いた多数決などで最終的な指し手を決定する手法をいう。 科学技術計算における研究における4倍長精度計算の応用可能性の一例としての本研究で、プレーヤーの多様性に着目し特別な目的関数を用いつつ将棋プレーヤーの学習に集団学習手法を適用し、合議プレーヤーを生成する手法の提案をおこなった。実験でははじめにBaggingを将棋プログラムの学習に対し適用して合議プレーヤーを生成し、既存のボナンザメソッドによる学習によって生成された単一プレーヤーや乱数合議との比較を対戦実験によりおこなった。さらにNegative Correlation Learningの考え方をBaggingによる将棋の集団学習に導入することによって生成された合議プレーヤーを対戦実験によって既存手法と比較した。実験の結果よく調整されたBaggingによる合議は乱数合議と同等の強さを持つこと、Baggingによる集団学習にさらにNegative Correlation Learningの考え方を用いて調整した合議は単一プレーヤーと乱数合議の双方に有意に勝ち越すことを確認した。本稿の結果は集団学習により強い合議プレーヤーを生成できることを意味し、今後様々な集団学習を用いた評価関数の学習が期待される。
|