研究課題/領域番号 |
26330417
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
池田 心 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (80362416)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 接待碁 / 指導碁 / 効用推定 / 楽しませる / 機械学習 / 囲碁プログラム |
研究実績の概要 |
本研究では,単に強いだけでなく,「人を楽しませる」ことを目的とした機能や特徴を持った囲碁プログラムを作成するための研究を行っている.人間同士のゲームでも“接待碁”と呼ばれる相手を楽しませることを目的としたゲームはしばしば行われ,これの調査分析により,(1)相手がどんな強さで何を面白いと思うかの推定,(2)形勢を制御・手加減してできれば最後には負けること,(3)しかしその手加減が不自然でないこと,(4)戦略が多様であること,(5)着手や投了のタイミングが適切であること,(6)自然言語で褒めたり驚いたりすること,が必要であることが1年目(平成26年度)の研究から分っており,(2)(3)(4)に対するアプローチが進められた. 2年目(平成27年度)は,(1)および(6),さらには「楽しませるだけではなく,教える」という方向性について研究が進展した. (1)については,囲碁ではなくRPGと呼ばれるゲームにおいて,人間プレイヤの着手だけから,そのプレイヤが何を求めているかを,効用という考え方とモンテカルロ法を組み合わせることで推定し,(対戦相手ではなく)チームメイトとしてそれに合致した着手を選ぶ手法を提案,被験者実験で効果を確認した. (6)については,囲碁では着手を座標ではなく「ツケ」「トビ」などと意味や形で表すことを踏まえ,機械学習によってこれを学習させる試みを行った.一致率は82%と,人間の高段者同士の一致率と同等に達し,プロからも高い評価を得た. 「教える」という方向性についても,“指導碁”を達成するために,悪手の検出,理由の分類と結果の説明,さらに解説図の作成などが必要であることをまとめ,不完全ではあるがプロトタイプを作成した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
この2年間で,6つの達成したい目標のうち(1)(2)(3)(4)(6)について,一通りの考察やアプローチを終えることができた.ただし(1)の効用推定についてはまだ囲碁に対する実装は行っていないし,(4)の戦略の多様さについては手作りに近い6つの戦略を提示しただけで,十分網羅しているとは言い難い.(6)については形の名前を言えるだけで褒めるなどの発話は実装していない.これらのうち一部は3年目の課題であるが,一部はもともと3年で完了することを見込んでいない. 一方で,接待碁の枠から,指導碁というさらに難しい目標へと研究が進展しており,3年目だけで解決できる問題ではないが今後数年の有望な方向性と考えている. 総合して,3年目で解決すべき課題はまだ残っているが,その多くは1年で達成可能と考えており,現在まで研究は順調に進展している.
|
今後の研究の推進方策 |
目標のうち(5)は,他研究者による将棋に関する新しい研究発表が相次ぎ,これを囲碁に応用することで達成できると考える.(4)については,人間同士の棋譜の分析などにより,多様な戦略の自動作成などを考えたい.(1)(6)の発展的実装については,必ずしも本研究の到達目標としていないが,プロトタイプの作成は行いたい. 今後,この研究は数年をかけて接待碁をベースとして指導碁に発展させていきたいと考えており,悪手の検出についてはすでに被験者実験を済ませ有望な結果が出ている(未発表).これを進めることで今後に繋げていきたい.
|