研究課題/領域番号 |
17K12807
|
研究機関 | 東京大学 |
研究代表者 |
竹内 聖悟 東京大学, 大学院新領域創成科学研究科, 特任研究員 (40625258)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 助言 / 協調 / ゲームプログラミング |
研究実績の概要 |
ゲームにおいて、他のプレイヤから助言を受けた際に有効利用する手法について研究を行っている。人工知能(AI)が社会において使われるようになり、その応用分野も広がっている。一方で、人間の知恵や直感が有効な場面も多く、人間とAIが協調するようなシステムな場面もある。AIの性能が人間を超えたものも多いゲームにおいて、その実現を目指す。 これまではゲーム中の局面において、「どの手が最も良いと考えるか」を助言として与えた際に有効活用する手法を研究してきた。今年度はより豊富な情報を活用するための予備的な調査とそれについての実験を行った。 豊富な情報として、コンピュータプレイヤが出力する、局面評価値を利用する。これは与えられた局面の優劣を数値化するものである。コンピュータプレイヤのグループでこれを活用した例としては、楽観合議と呼ばれる手法がある。一般的な合議は指手を多数決で決定するが、楽観合議では同じプログラムに乱数を加え、評価値の最も高い指手を採用するという手法で、単純な多数決合議よりも良い結果を得ている。 異なるコンピュータプレイヤ間では、評価値のスケールが異なるために単純な比較ができないという問題がある。助言において評価値の利用をするならば、スケールの調整を考える必要がある。異なるプレイヤ間のスケール調整を考え、既に有用性が示されている楽観合議においてスケール調整が有効であることを示し、その後に助言における活用を考える。現在は、楽観合議において予備実験まで行った段階で、スケールの結果も踏まえて投稿の用意を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度の計画のうち「その理論的背景の調査」が難航している。計画では、関連手法である合議や3-Hirnの理論的背景や解析の利用を考えていたが、ゲームプログラミングの分野では余り例がなく、調査が遅れている。 「助言が有効となる条件」については、実際に実験やその予備実験を行った結果として、当初の計画よりも計算コストがかさむことが判明したため遅れが生じている。
|
今後の研究の推進方策 |
実験的に有効な条件を探るための実験で膨大な組み合わせが生じるため、何らかの絞り込みを行うことを考えている。一般に強いプレイヤに興味が持たれるため、強いプレイヤ間の組合せに絞るなどの手法が考えられる。 また理論的背景についてはゲーム以外の分野での調査を考えている。合議は多数決による投票・意思決定の手法であり、ゲーム理論や社会選択理論といった分野で研究がされている。これらの分野における類似の手法の理論的解析や実験的な手法について調べることで推進していく。
|