研究課題/領域番号 |
17K00514
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
エンタテインメント・ゲーム情報学
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
橋本 剛 松江工業高等専門学校, 情報工学科, 教授 (40420335)
|
研究期間 (年度) |
2017-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2017年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 強化学習 / 反復広化法 / 顕著性マップ / 汎用ゲームAI / 生物学的制約導入 / 弾幕シューティングAI / Muzero / ガイスター / MuZer / ロボット掃除機 / Gazebo シミュレータ / TurtleBot3 burger / 方策勾配 / UCT探索 / 不完全情報ゲーム / ドミニオン / 方策勾配法 / 反復広化 / Pomberman / 連鎖型パズルゲーム / DQN / 音楽ゲーム / ゲームAI / ぷよぷよ / 視覚的顕著性モデル / ニューロエボリューション / モノポリー / 汎用的機械学習 / Deep Q-Network / 弾幕シューティング / Ms.Pacman / 機械学習 / ゲーム / Deep Learning / テトリス / マリオ / 麻雀 / 熟達化 / 汎用人工知能 / シューティングゲーム |
研究成果の概要 |
人間的に上達する汎用ゲームAIの実現を目指し、さまざまな題材で手法を開発した。人間の熟達化にヒントを得て反復広化法を提案し、まずはテトリスで、その後ぷよぷよやPommermanの強化学習でその効果を確認した。また、画像の色やエッジなどの特徴量から計算した人間の注視度、顕著性に着目し、顕著性マップを用いた強化学習手法を提案し、弾幕シューティングAIやMs.Pacmanの強化学習でその効果を確認した。他にも、スーパーマリオ無限1up学習、音楽ゲーム強化学習への生物学的制約導入による人間らしさ創出、ガイスターの紫駒探索法開発、実環境に近い環境をゲーム化しMuzeroで学習する手法などで成果を上げた。
|
研究成果の学術的意義や社会的意義 |
近年、AI強化学習の研究が世界中で盛んに行われているが、効率よく学習をさせるために、人間の学習に着目し、人間らしい強化学習を可能にするための手法をいくつか提案し、評価しやすいゲームAIで実装し実験によりその効果を示した。これら手法が強化学習に取り入れられることで、より少ない計算資源で高い学習効果を上げられる。また、音楽ゲーム強化学習への生物学的制約導入による人間らしさ創出、実環境に近い環境をゲーム化し学習する手法など、実社会に近い題材でも応用可能な成果を上げ強化学習の新たな方向性を示すことができた。
|