研究課題
挑戦的研究(萌芽)
人工知能分野の強化学習では、環境の中で自律的に行動するAIエージェントを想定し、そのエージェントが試行錯誤を通じて振る舞いを学習する技術を扱う。本研究では、不完全情報かつ多人数のゲームを題材に、潜在的な環境のモデルを含めて学習する技術を開発し、広い分野でAIエージェントの強化学習技術の適用を容易にするために研究を行った。数理的なモデルの検討と計算機実験による評価を行い、詳細は、学術論文として発表している。
ゲームプログラミング
強化学習は、最近では LLMs のような自然言語を操る巨大AIモデルの学習まで含む、広いを応用範囲を持つこれからの社会の基盤技術である。この強化学習技術を成熟させ、誰もが使えるようになることは自由な研究ひいては社会活動のために重要と考えられる。AlphaZeroのような2人完全情報ゲームに対象を限定した場合と比べて、現実の諸問題への強化学習技術の応用はさまざまな難しさを含むが、本研究課題はその解消に向けて2人や完全情報という制限を外した際の難しさを扱った。