2021 Fiscal Year Research-status Report
心理誘導型の探索技術の応用により人との暗黙的な結託を図れるゲーム人工プレイヤ開発
Project/Area Number |
21K17872
|
Research Institution | Sasebo National College of Technology |
Principal Investigator |
佐藤 直之 佐世保工業高等専門学校, 電子制御工学科, 准教授 (30826889)
|
Project Period (FY) |
2021-04-01 – 2023-03-31
|
Keywords | ゲーム情報学 / エンターテイメント |
Outline of Annual Research Achievements |
※対外発表は現在まだ一件もない(後述するが今秋に研究会への応募と発表を行う予定)ため,作業や実装の進捗についてのみを記す. 【麻雀における課題局面の作成】本研究は一部の(強力な)人間プレイヤに対抗するために,他の人間プレイヤ達にゲーム内で結託をもちかけるAIプレイヤの作成を目指す.そのため麻雀において,(a)プレイヤ間の結託があきらかに当事者たちに有利になり,(b)結託を求める意思が当事者たちの間で伝わりやすい,というような局面の準備を行った.いくつかの文献も参考にした上で,10件程度の局面を準備できた. この課題局面では一人のプレイヤが自己の(本来は秘匿である)情報を開示しており、自身のアガリ点が低いことを公開している.そして捨て牌の分布によって、そのプレイヤのアガリに必要な牌もおおよそ検討がつくようになっている.ここに、現在の順位は低いが、非常に高い点の役を狙っていることが明白なプレイヤを用意することで、その他のプレイヤに「低いアガリ点の役が完成すること」を協力するように呼び掛ける. 【麻雀対戦環境の構築】本研究で用いるゲームAIの動作環境を自作した.麻雀をコンピュータと人間が対戦できるような環境・ツールは既に存在するが,「こちらが臨んだ局面からゲームを開始できる」ような環境は見つからなかった.そのために,対局の開始から終了まで,AIプレイヤが対戦でき,更には好きな局面からゲームを開始できるような設計の自作環境を,C#により準備した.AIプレイヤのコードは、ベースがモンテカルロ木探索手法で動作し、不完全情報の推測のためにも、モンテカルロ法をベースにしたシミュレーション手法を用いている.
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
当初の予定では,麻雀を対象とした提案手法AIプレイヤの実装および実験,そして成果発表が済み,カタンを用いた実装に進んでいる段階である.しかし現状は,麻雀を対象とした実装と実験の途中段階である. (1)主な理由は「課題局面の準備のためのコストが想定以上に高くついた」ためである.麻雀は不完全情報ゲームであり,対戦相手に多くの情報を隠してプレイする.そのため,各プレイヤがどういう状態にあるのかを推定するためには,限られた情報から各プレイヤの手牌などを大まかに推測できるほどの,ゲームに対する熟練を必要とする. それゆえに,本研究で用いる課題局面の準備のためには,(不運にも過去の文献には手ごろな事例が見つけられなかったため)申請者がゲーム内知識を高い水準で身に着ける必要があった.戦術書や解説書を読み込み,コーチング等も利用して,研究に利用可能な課題局面を自作できるようになるまでに,半年以上の時間を追加で必要とした. (2)前述の理由に対して影響は小さいが,「既存の麻雀AI開発環境の利用困難」も理由の1つである.本研究では麻雀でAIと人間が一緒に遊べることが求められるが,こちらが指定した局面からの対戦が行えることも非常に大切である.既存の麻雀AI環境に,要請を満たすものが見つけられなかったため,申請者による自作を考えた.ルール等のシステム面やAIプレイヤの作成などのために余分な期間を3ヶ月以上,必要とした.
|
Strategy for Future Research Activity |
提案手法の環境とAI,そしてデータ取得のための課題局面を組み合わせて実験を行い,研究会への発表を行う.具体的には直近に控えた国内研究会である,Game Programming Workshop 2022への原稿応募と口頭発表を行う予定である.必要なコード等は揃っていて、デバグとデータ取得を行っていく段階である.そのため,発表は十分に間に合うペースであると考えている. とはいえ,その時点でも成果物の性能に向上の余地が大きく残っていると予想達成できるため,研究会以降も環境やコードの改善を行うことを考えている.そして十分に客観的で信頼できる性能の向上が確認できたならば,成果を論文にまとめることを検討して,以降は次の対象ゲームに切り替えた上で提案手法を試験したい. 次の対象は『カタン』であるが,これも既存の環境は本研究への適用に難があるため,研究に最小限のクローンを自作して研究を推進したい.
|
Causes of Carryover |
研究の遅れにより、研究会への出張が取りやめになったため.他の研究会へこれから出張することによって、その額を利用する.
|