• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 研究成果報告書

不完全情報かつ多人数環境で合理的均衡戦略を求める深層強化学習

研究課題

  • PDF
研究課題/領域番号 21K19816
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分62:応用情報学およびその関連分野
研究機関東京大学

研究代表者

金子 知適  東京大学, 大学院総合文化研究科, 教授 (00345068)

研究期間 (年度) 2021-07-09 – 2024-03-31
キーワードゲームプログラミング
研究成果の概要

人工知能分野の強化学習では、環境の中で自律的に行動するAIエージェントを想定し、そのエージェントが試行錯誤を通じて振る舞いを学習する技術を扱う。本研究では、不完全情報かつ多人数のゲームを題材に、潜在的な環境のモデルを含めて学習する技術を開発し、広い分野でAIエージェントの強化学習技術の適用を容易にするために研究を行った。数理的なモデルの検討と計算機実験による評価を行い、詳細は、学術論文として発表している。

自由記述の分野

ゲームプログラミング

研究成果の学術的意義や社会的意義

強化学習は、最近では LLMs のような自然言語を操る巨大AIモデルの学習まで含む、広いを応用範囲を持つこれからの社会の基盤技術である。この強化学習技術を成熟させ、誰もが使えるようになることは自由な研究ひいては社会活動のために重要と考えられる。AlphaZeroのような2人完全情報ゲームに対象を限定した場合と比べて、現実の諸問題への強化学習技術の応用はさまざまな難しさを含むが、本研究課題はその解消に向けて2人や完全情報という制限を外した際の難しさを扱った。

URL: 

公開日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi