研究課題
思考ゲーム、特に囲碁、将棋、チェスなどの二人完全情報ゲームでは、ここ数年のAlphaGoからAlphaZero までの研究で、既存手法で作成されたAIプレイヤや人間の強さを越えて、大きな技術の進歩があった。本応募課題ではそれらの成果を踏まえて、思考ゲームを題材に、深層強化学習の汎用性と効率向上の研究を行った。囲碁、将棋、チェスなどの思考ゲームは AI の到達度を測る試金石として、また AlphaGo が登場して以降は深層強化学習の題材としても注目を集めている。熟慮して判断の質を高めるためには、エージェントが確率的な推論や思考実験をできるような世界のモデルが必要となる。抽象的な表現で世界を学ぶことで汎用性と学習効率を高め、環境とエージェントの多様性に適切な抽象度を学ぶことが目標である。本課題では深層強化学習において、抽象化と多様性を扱う技術を核に手法のプロトタイプを作成し、理論的検証と予備的な計算機実験を行った。特にエージェントの学習過程において一般化・抽象的した理解を奨励するために、多様な経験を自然に与える技術に注力した。強化学習の状態空間も広いためエージェントが経験できる範囲も限られる。そのため、エージェントが経験した範囲をモデル化するという自然なアプローチでは、本質的に世界の一部分しかモデル化出来ないという制約がある。その前提で実用的な性能を実現するためには、なんらかの方法で重要な状態を判別してその付近を重点的に経験する必要がある。このために、異なる視点や興味を持つ、多様なエージェントが有用である。
令和5年度が最終年度であるため、記入しない。
すべて 2023
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (2件)
IJCAI
巻: ijcai.2023/477 ページ: 4289-4298
10.24963/ijcai.2023/477
IEEE international joint conference on neural networks
巻: IJCNN54540.2023 ページ: 1-8
10.1109/IJCNN54540.2023.10191336