人間的に上達する汎用ゲームAIの実現を目指し、さまざまな題材で手法を開発した。人間の熟達化にヒントを得て反復広化法を提案し、まずはテトリスで、その後ぷよぷよやPommermanの強化学習でその効果を確認した。また、画像の色やエッジなどの特徴量から計算した人間の注視度、顕著性に着目し、顕著性マップを用いた強化学習手法を提案し、弾幕シューティングAIやMs.Pacmanの強化学習でその効果を確認した。他にも、スーパーマリオ無限1up学習、音楽ゲーム強化学習への生物学的制約導入による人間らしさ創出、ガイスターの紫駒探索法開発、実環境に近い環境をゲーム化しMuzeroで学習する手法などで成果を上げた。
|