研究課題/領域番号 |
18K11603
|
研究機関 | 大阪教育大学 |
研究代表者 |
藤田 修 大阪教育大学, 教育学部, 教授 (10324881)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 人工知能 / 抽象戦略ゲーム / ゲームデザイン / ゲーム木 / 機械学習 / 強化学習 / 数理モデル / エデュテインメント |
研究実績の概要 |
この研究の目的は、1)人工知能を用いて抽象戦略ゲームのデザイン(各種ルールの条件設定)を自動化すること、2)難易度の異なるゲームルールを設定し、ゲーム木の複雑度などについて数理的分析を行うこと、3)人を惹きつけるゲームの魅力について、ゲーム木の数理的特性との関係性を明らかにすること、4)その知見をエデュテインメントに応用し、人の学習システムの設計・開発に役立てること、などである。 現在、ゲームのプロトタイプの作成と人工知能プレイヤーの作成の初期段階である。前述の目的に適したゲームルールの条件は、1)ルールが単純なものから複雑なものまで設定可能、2)駒の種類が少なくても多様な局面を生成可能、3)勝敗判定が単純明快、4)人工知能の構築が容易、などである。 プロトタイプの一つとして、将棋と類似した新規のゲームを考案し、インターネット上で利用可能なアプリソフトを制作した。現在、棋譜の収集のための機能追加に加えて、携帯端末等でも動作可能とするために他言語への移植を行なった。 人工知能プレイヤーの作成は基本検討の段階で、ゲームの局面を表現する記号列に対する評価関数を機械学習で求める方法を検討している。ただし、現状で最も有用と思われる教師あり学習は教師データが必須であるが、新規考案のゲームには学習すべき教師データとなる棋譜データが乏しく、これを適用するのは困難であるため、詳細棋譜が不要な強化学習を採用する方針である。この場合、膨大な学習計算量が必要となる可能性が高く、その難点の解決策として高速化に有効な並列計算専用ハードウェアの選定を進めている。 また、囲碁でディープラーニングの有効性が明らかにされたため、2次元画像パターンを直接入力する機械学習システムの検討も開始した。その数理モデル構築の一環として、確率的生成モデルに有用な確率密度関数の性質と応用について理論的検証を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
抽象戦略ボードゲームのプロトタイプの作成については、ボードの形状、駒の種類(レーザーと反射鏡)、駒の配置と一手の動き、プレイヤーの数、勝敗判定、反則などの詳細ルールについて、バリエーションの範囲をおおよそ絞り込んだ。プログラム実装については、AdobeFlash(Actionscript)を利用した人対人の対戦可能なアプリ制作、棋譜のフォーマット決定、棋譜の自動記録機能の追加、また、各種端末対応のため、Unity(C#)への移植まで進んでいる。 人工知能の構築はまだ検討の初期段階である。従来の機械学習アルゴリズムは膨大な計算量を必要とし、現状の乏しい計算機資源で実時間内に構築することはかなりの困難が予想される。その解決のためには、専用の並列計算機を同時並行して開発する必要があり、FPGAなどのプログラマブル・デバイスで実装可能な基本構成を検討中である。 ディープラーニングとの比較検証については、その高速化に有効とされるGPGPUシステムを購入する計画であったが、当初予定のGPUが陳腐化した一方で、Tensor Core などの新技術を搭載した高性能な新製品が商品化されたため、機械学習計算システムについて再検討した。その結果、価格・性能・信頼性・将来性の観点から、現時点で入手可能な高価格製品の本格導入を延期し、廉価版GPUによる予備試験を先行させることに計画変更した。 囲碁などのボードゲームでは画像パターンの認識も重要であるため、確率的生成モデルの活用についても検討項目に加えた。現在、混合分布モデルに適した確率密度関数の工夫により尤度が改善される効果などについて、理論的検討を進めている。
|
今後の研究の推進方策 |
ゲーム制作においてユーザーインターフェースは実用上不可欠であり、今後とも改善の余地があるが、AI構築においては必ずしも必要な機能ではないため、優先順位を下げる。今後は、入力操作・表示機能を切り離して、人工知能開発に特化した記号列生成プログラムとゲーム木生成・分析プログラムの実装に注力する。また、同時並行して、記号系列評価関数の最適化、集合間距離を利用したゲーム木の定量的分析についての理論的検討も重視する。 強化学習の計算時間短縮については、基本的なアルゴリズムの工夫とその専用並列計算ハードウェア・アーキテクチャの考案が重要であることに変わりはない。現時点で利用可能な既存の各種計算システムの比較検討も必要であるが、単純な規模拡大を必要とするシステムは採用しないことが前提である。あくまで、消費エネルギーの節約も含めて、コスト・パフォーマンスに優れたアーキテクチャを模索する。そのような観点からは、特殊計算などに固定化されたGPGPUよりも、各種演算を実装できる可能性を有するFPGAなどのプログラマブル・デバイスの方が自由度や有用性が高いと考えられる。今後、より汎用性の高いアクセラレータ・カードなどの技術開発動向を注視する。
|
次年度使用額が生じた理由 |
当初、デーィプラーニング専用計算機として購入を予定していた物品の技術内容が陳腐化し、高性能化された新製品が発表されたため、購入物品について再検討したが、価格・性能・信頼性・将来性の観点から早計な選定を避け、一旦、購入を保留することにした。その代わり、廉価版の新製品を他の予算で購入して予備的な評価試験を行うとともに、現在は開発途上ながら将来性の高い技術を有する新開発製品も含めた最適な購入物品の選定について、次年度以降に再検討することを計画している。 具体的には、申請時点の見積品(GPUワークステーション)はNVIDIA Tesla P100、新製品はNVIDIA Quadro GV100、廉価版の新製品はNVIDIA Geforce RTX2080、追加検討の新開発製品は Xilinx Alebo U250、Intel FPGA PAC等である。
|