2011 Fiscal Year Annual Research Report
Project/Area Number |
22500123
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
伊藤 毅志 電気通信大学, 大学院・情報理工学研究科, 助教 (40262373)
|
Keywords | コンピュータ将棋 / プレースタイル / 評価関数機械学習 / 模倣AI / 主観的評価 / ゲーム情報学 |
Research Abstract |
コンピュータ将棋は近年十分に強くなり、コンピュータ将棋プログラム「ボンクラーズ」は引退棋士ではあるが元名人の米長邦雄永世棋聖に勝利を収め、プロ棋士を脅かす強さになっている。これからのコンピュータ将棋は、強さだけでなく対戦して面白いプログラムが求められている。本研究では、トップレベルのプログラムであるBonanzaの評価関数の機械学習の手法を応用して、プレーヤーの棋風を反映した将棋プログラムの作成を目指す。 また、作ったプログラムが実際にプレーヤーの棋風を反映しているのか、対戦して面白いものになっているのかを主観的評価だけでなく、実際の棋譜の統計的な差異を調べることで明らかにしていく。 平成23年度は、模倣したいプレーヤーの棋譜を偏重して学習させる手法を提案し、実際にBonanzaの学習機能を応用して、攻めと受けの棋風に定評のあるプロ棋士6名について模倣したシステムを作成した。 上述のように作成した模倣AIによって生成された棋譜を、プロ棋士の被験者に評価させる実験を行った。その結果、幾つかの特定のプロ棋士については、被験者全員が正解を導くなど、棋譜の模倣が一定の成功を収めたことが示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の研究目的にそって、プロ棋士へのアンケートに基づいて、Bonanzaメソッドを用いて機械学習により特定の棋士の棋風を模倣するシステムを構築した。この手法に基づいて、膨大な棋譜でなくても100局程度の棋譜が集まれば、当該の棋士の棋風をある程度模倣できる可能性を示唆できている。
|
Strategy for Future Research Activity |
当初の予定では、評価方法として、対戦における面白さを主観的評価のみではなく、生体信号(視線計測、fNIRS、発汗計測)を用いて行なっていくとしていたが、予備実験としてゲームをプレーする人間の心理状態を計測する実験を発汗計測、瞳孔径、脈波などの生体信号を用いて行なってきたが、どれもあまり良い成果が出ていない。この点について、計測器の精度を高める方法を模索するなどして、検討を続けていくが、あまり良い成果がでなければ、主観的評価のみで行なっていく可能性もある。なお、主観的評価まででは、一定の成果が認められるので、ここまでをまとめて、研究会や論文として発表していく予定である。
|
Research Products
(4 results)