研究課題/領域番号 |
18K11603
|
研究機関 | 大阪教育大学 |
研究代表者 |
藤田 修 大阪教育大学, 教育学部, 教授 (10324881)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 人工知能 / 抽象戦略ゲーム / ゲームデザイン / ゲーム木 / 機械学習 / 数理モデル / グラフ間距離 / 並列処理 |
研究実績の概要 |
この研究の目的は、機械学習を利用して、抽象戦略ゲームのデザイン(各種ルールの条件設定)を自動化すること、さらには、その知見を人の学習システムに応用することである。現在、その初期段階として、機械学習に適したゲームの数理モデルの構築と分析、並びに、コストパフォーマンスに優れた学習演算アルゴリズムの開発とその並列処理専用ハードウェアの環境構築について取り組んでいる。 数理モデルに関する理論的なアプローチとしては、第一に、ゲーム木の分析方法や戦略方策の判断基準となりうる評価関数として、グラフ間距離を利用することを検討している。グラフを集合として定義してその集合間距離を算出し、グラフの類似性、複雑度などの定量的評価への適用可能性を調べている。 第二の理論的アプローチとしては、機械学習における最適化問題でよく現れる「組合せ論的爆発」と呼ばれる困難性を解決するための手段として、ゲームの離散的な数理モデルから連続的な数理モデルへの変換方法について検討した。その過程で、基本的なモデルとして、複雑な確率モデルの構築が可能な混合分布モデルを取り上げ、そこに新規の確率密度関数を導入すえることにより、AIC / BICの情報量基準によるモデル選択において改善効果が期待できることを理論的かつ数値実験的に明らかにした。この結果を論文にまとめて公表する準備を行っている。この研究課題は当初の予定には含まれていなかったが、ゲームの数理モデルへも活用する方向で検討している。 他方、実験的アプローチでは、グラフ間距離の算出や強化学習における膨大な計算量の問題を解決する方法として、並列処理による高速化のため、専用演算ハードウェアの利用について検討している。現在、準備段階の位置付けで、廉価版のCUDA-GPGPUとFPGAの2種類を購入し、その性能の比較評価のため、計算機環境構築と動作検証の準備を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
理論的研究課題については、当初の計画には含まれていなかった内容を追加して、ゲームの数理モデルを離散的な枠組みから連続的な枠組みに変換することを目的とする確率生成モデルの検討を行った。現在、混合分布モデルに適した確率密度関数の工夫により尤度が改善されることについて、理論的・数値実験的な研究において良好な結果が得られたので、論文にまとめて公表する準備を進めている。その間、グラフ間距離に関する研究については優先度を下げ、時期を繰り下げることにした。 プログラミングを含む数値実験的課題については、ゲーム木の分析と戦略評価のためグラフ間距離の計算を専用の並列処理で高速化・省コスト化することを目的として、専用ハードウェアの採用を検討していたが、メーカー各社の技術開発の動向に変化があった。当初、CUDA を利用したGPGPUシステムを購入する計画であったが、GPUが陳腐化する中で、Tensor Core が商品化されたため、予定を変更してその性能を検討した。しかし、ディープラーニングに特殊化された計算機能が固定的なため、高価格に見合う成果が得られにくいと判断された。その一方で、FPGA プログラマ ブル・アクセラレーション・カードが入手可能となったため、その柔軟性・汎用性に期待して、廉価版を購入して環境構築と動作性能の検証を行うよう方向を再度転換した。
|
今後の研究の推進方策 |
ゲームの数理モデルの一つとして記号列生成プログラムを作成し、そのゲーム木生成・分析プログラムおよび戦略評価の検討を進める。また、同時並行して、記号系列評価関数の最適化、集合間距離を利用したゲーム木の定量的分析、さらに、数理モデルとして連続的な確率モデルの導入についての理論的検討を行う。 ゲームプレイヤー用人工知能としては主として強化学習を利用する予定である。強化学習には膨大な計算時間が必要と予想されるため、計算時間短縮の観点から基本的なアルゴリズムの工夫を行い、その専用並列計算ハードウェア・アーキテクチャの開発を目指す。その準備段階として、現時点で利用可能な既存の各種計算システムの中で、パソコン程度の小規模システムでも利用可能な、CUDA-GPGPU、OpenCL、TensorCore、FPGAの比較検討を行う。高速化性能のみならず、開発の容易さ、消費電力等の省エネルギー性能、多様なアルゴリズム対応への柔軟性、汎用性、将来性、スケーラビリティなど、総合的なコスト・パフォーマンスを重視する。その点、FPGAが最も有望と期待される。ただし、利用可能な回路ライブラリが十分に揃っていない場合、独自に専用回路を設計する必要があり、回路アーキテクチャの概念設計やFPGAでの実装設計・開発など、かなりの時間がかかる可能性が高い。また、新規の回路アーキテクチャをFPGAに実装することが困難な場合は、仮想的なモデルについて数値シミュレーションにより性能評価を行う予定である。
|
次年度使用額が生じた理由 |
当初、並列計算専用ハードウェアとして購入を予定していたGPUカードの技術が陳腐化し、深層学習の計算に特化した新技術のTensorCore が商用化されたため、当初の予定機種の購入を中断し、新技術についてコストパフォーマンスを検討する必要があった。その後、TensorCore の搭載機種が高価格ながら汎用性に欠けると判断した時期に、さらに全く異なる新技術のFPGAアクセラレーション・カードが商用化され、その性能に期待して、それを購入することに方向転換を図った。しかし、新技術のため、動作検証が完了したホストコンピュータが高価格品に限定されており、購入が困難であった。そこで、動作保証されたホストコンピュータで購入可能な機種が増えるまで、購入を時期を遅らせることが最善であると判断した。
|