研究実績の概要 |
研究内容:チェス、将棋、二人ポーカーなどの思考能力を競う幾つかのゲームにおいて、現在の人工知能は人間よりも強くなりつつある。また、デジタルゲームにおいても、アクション及びシューティングゲームのノンプレイヤブルキャラクタ(NPC)は、ほぼ正確な行動をとることが可能である。その一方で、行動の選択肢が多く、ゲーム状態や状態間の遷移を部分的にしか観測できない、現実世界における競争により近いゲームにおいて、人工知能を強くする技術はチェスやアクションゲームに見られるほどには発達していない。本研究では、既存ヒューリスティック手法の大規模化を達成することにより、このようなゲームにおいて競争に勝つ人工知能技術の開発を目指した。 実績概要:平成29年度は、囲碁、麻雀、大貧民、チェスを題材に選び、本研究計画を実行した。平成30年度は、前年度の研究内容を発展させるため、より多様なルールのゲームにおいて研究を行うために、デジタルカーリングを新たな題材として選び同計画を実行した。この研究成果は和論文誌(松井亮平, 保木邦仁, 強化学習法によるデジタルカーリングの初歩的な行動知識の獲得, 情報処理学会論文誌, 59(11), pp. 2063-2073, 2018)にて報告された。概ね順調に進展してはいるが、一部の研究内容 (麻雀人工知能) に平成30年度までの総括・発表が間に合わなかったものがあったため1年間同研究を継続した。継続した研究は、平成31年4月に arXiv 上で成果発表し (arXiv:1904.07491v1)、そして、結果をさらにまとめた原稿を現在海外ジャーナル論文誌に投稿中である。
|