Project/Area Number |
23K11381
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62040:Entertainment and game informatics-related
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
池田 心 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (80362416)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2023: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
|
Keywords | 楽しませるゲームAI / 囲碁 / 人間の誘導 / 着手モデル / 好みモデル / 深層学習 / 指導するゲームAI / 囲碁プログラム / 楽しませる / 手加減 / 局面の誘導 / 指導碁 |
Outline of Research at the Start |
囲碁ゲーム等における人工知能プレイヤ(以下,AIプレイヤ)の強さはいまや十分であるが,強いだけのAIプレイヤの挙動は理解や真似がしづらく,一般プレイヤが楽しみながら上達するには不適である.AIプレイヤを人間らしく振舞わせる,ほどよい手加減を行うなどの研究が行われているが,AIプレイヤ側の出力を考慮するだけでは,必ずしも望ましい試合展開にならない. 本研究では,プレイヤ側の着手を適切に“誘導”することを狙う.すなわち,プレイヤの技量・対戦目的・好みに合わせ,「プレイヤの強みが発揮されやすい試合展開」,「課題が露呈しやすい試合展開」,「プレイヤが楽しめる試合展開」などに状況を誘導する技術を研究する.
|
Outline of Annual Research Achievements |
人間よりも強くなったゲームAIを使って,人間をどのように楽しませまたは指導するかというのは,近年の重要な研究テーマである.本研究は,主に囲碁を対象に,単に自然な手加減を行うだけではなく,人間プレイヤの強みや弱み(課題)を引き出すような局面に誘導することを目指す研究である. この目的を達成するためには,(1) 人間が「一般に」または「棋力帯ごとに」あるいは「個人ごとに」どのような局面でどういう間違いを犯しやすいのかを適切にモデル化すること,(2) それを既存の手加減システムのアプローチと組み合わせ,適切に導入すること,が必要になる. 初年度はこれらの土台作りを行った.具体的には,(2)の土台としては,強い囲碁AIと,人間の棋譜を教師あり学習した着手確率分布を組み合わせることにより,「十分な手加減」「不適切な着手の排除」「着手の自然さ」「人間の出来不出来が勝敗に反映されること」の4つの指標がこれまでよりも優れる手法を開発した(国際ジャーナルに採録). また(1)の土台としては,やはり強い囲碁AIと人間の棋譜を学習したモデルを組み合わせることで悪手の推定モデルを改善し,そのうえで,アマチュアの棋譜を大量に分析し,棋力帯ごと,個人ごとにどういう悪手の傾向があるかを分析した(国内研究会で研究奨励賞受賞).また,“個人ごと”という点に関連して,人間プレイヤがどのような試合を面白い/つまらないと思うのか,実際に囲碁AIをサービスしている会社と共同研究することで,例えば「大勝すると楽しい」「僅差の試合のほうが楽しい」といった異なるグループが現れることを確認した(国際会議に採録).
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は3年間の間に「人間プレイヤを強みや弱みが出やすい局面に誘導することで楽しませたり指導する」ことを目指す.強みや弱みの分析や,楽しませる方法論については,1年目でおおまかな土台ができたと考えている.また,人間の着手の誘導のためには「この局面で人間がどう打つのか」をある程度の精度で推定できなければいけないが,そのために強い囲碁AIと教師あり学習の結果をうまくブレンドする方法を開発できており,その実現可能性は高いと考えている.
|
Strategy for Future Research Activity |
1年目の結果を踏まえて,2年目は「ある局面が,そのプレイヤにとって強みのあるものか,弱みのあるものかを判断する」機構と,「強みまたは弱みのある局面に誘導する」機構の開発に取り組む. 弱点については,これまでの分析や指導者との議論から,例えば“形は良いが臆病”“攻め合いに強いがポカも多い”などいくつかのパターンがあることが分かっている.局面とプレイヤの着手モデルがあれば,そのプレイヤの弱点パターンに当てはまるかどうかは判断できるだろう. 局面誘導については,誘導の強さと,そもそもの着手の自然さや手加減度合いを適切にバランスすることが必要である.ただし,研究の推進方策としては,まず強い誘導を(自然さ等を度外視して)試み,それがうまくいったらバランスすることを考えたい.
|