研究課題/領域番号 |
17K12809
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
エンタテインメント・ゲーム情報学
|
研究機関 | 関西学院大学 |
研究代表者 |
大用 庫智 関西学院大学, 総合政策学部, 講師 (60755685)
|
研究期間 (年度) |
2017-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 強化学習 / 機械学習 / バンディット問題 / 探索 / モンテカルロ木探索 / 人工知能 / 満足化 / 認知科学 |
研究成果の概要 |
ゲームAI やロボティクスを初めとした巨大な探索空間において、強化学習で最も重要な課題である「速さと正確さのトレードオフ」の既存の限界を超える手法の開発が行われている。そこで本研究では、その既存の限界を突破するため、既存研究とは別のアイディアとして人間の満足化の概念を探索技法の中心的な役割を果たす木探索(モンテカルロ木探索)へ実装し、新しい探索技法の開発を進めた。また、モンテカルロ木探索において満足化の優れた性能を示した。
|
研究成果の学術的意義や社会的意義 |
本研究は、人間の適応的な意思決定方法を探索能力として活用する。強化学習技術の枠組を用いて、その探索能力を探索技法の中心的な役割を果たす木探索への実装に着目した。本研究は一般性が高いものであると考えており、各既存問題に応用する際に、複雑なアルゴリズム化等が不要であることから、バンディット問題の応用例である様々なゲームAI や、スケジューリング、最適化問題等の幅広い領域での結果の一般性が期待でき、幅広い探索問題への波及効果があると考えている。
|