研究課題/領域番号 |
18K11603
|
研究機関 | 大阪教育大学 |
研究代表者 |
藤田 修 大阪教育大学, 教育学部, 教授 (10324881)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 人工知能 / 抽象戦略ゲーム / ゲームデザイン / ゲーム木 / 機械学習 / 数理モデル / グラフ間距離 / 並列処理 |
研究実績の概要 |
抽象戦略ゲームのデザイン(各種ルールの条件設定)を機械学習を利用して自動化するための数理モデルについて、その基礎的理論となるゲーム木の定量的分析手法と、具体的なゲームに対する人口知能プレイヤーの構築、その両方で必要となる大規模な数値計算を高速かつ低消費電力で実行可能な並列処理専用ハードウェアの計算機環境構築を同時並行で実施している。 数理モデルの観点で重視しているゲーム木の分析については、ノード集合とエッジ集合からなる単純なグラフとして表現する場合と、親子関係について階層化された複合的な集合として表現する場合とに分け、それぞれの表現型に適した集合間距離を定義し、その多様な組み合わせについて比較検討した。大規模なデータの相互関係を定量化することは極めて困難な課題であるが、統計的な手法の導入により評価指標の妥当な近似値が得られる見込みである。 確率モデルの構築については、一般的に多用されているガウス混合分布の補完的位置付けとして、分布の一部に平坦性を有する混合分布モデルを構築する場合には、複合的関数を用いた確率密度関数が情報量基準の観点から有用であることを理論的かつ数値実験的に明らかにした。論文原稿がほぼ仕上がり、現在、投稿手続きの準備を行っている。 数理モデルの実行システムについては、並列処理による高速化と消費電力の削減を目的として専用演算ハードウェアの概念設計を進めた。具体的には重要成分を優先して計算する方式においてキーデバイスの一つとなるハードウェアソーターと共有メモリシステムを対象とした。その性能予測のため、廉価版の2種類のFPGAアクセラレータ(Intel Altera系とXilinx系)を利用した実験環境を構築中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
理論的研究課題の確率生成モデルの検討については、主題の結果は比較的早期に得ていたものの、多数の代替手法との比較検討や周辺の詳細特性に関する緻密な検証などに時間を要したため、論文原稿の執筆が想定以上に遅れた。 ゲーム木のグラフ構造分析に用いる集合間距離に関する研究については、多様な定義の可能性があり、評価の目的に応じて使い分けることを念頭に検討を進めている。ただし、現段階では選択肢が多く、対象を絞りきれていない。具体的なゲーム木の生成・収集・分析とも同時並行して進める必要もあり、じっくり腰をすえて取り組んでいる。 専用ハードウェアの検討については、当初計画していたCUDA を利用したGPGPUシステムの本格導入は中止し、FPGAアクセラレータの採用に変更した。方式の異なる2種類(Intel Altera系とXilinx系)があり、どちらかを選択しなければならないが、まだ明確な結論は得られていない。技術的な問題や社会状況等の影響も受け、遅れが生じた。 ゲームプレイヤーのAI構築とCUDAを利用した深層学習の高速処理に関する応用的研究については優先度を下げているが、Adobe Flash で作成されたスクリプトの他言語への移植作業は適宜研究協力者の助力を得て進めている。ただし、最近の一年間程、研究協力者が不在となり、作業が停滞した。
|
今後の研究の推進方策 |
確率モデルの研究への比重を減らし、ゲーム木の理論的分析研究に重点を置く。前年度予定していた記号列生成プログラムの作成を行い、そのゲーム木生成・分析プログラムおよび戦略評価の検討を進める。また、記号系列評価関数の最適化、集合間距離を利用したゲーム木の定量的分析の理論的検討を行う。 学習計算ゲームプレイヤー用人工知能としては主として独自の強化学習を利用する予定である。強化学習には膨大な計算時間が必要になると予想されるため、計算時間短縮の観点から基本的なアルゴリズムの工夫を行い、その専用並列計算ハードウェア・アーキテクチャの開発を目指す。 FPGAアクセラレータ(Intel Altera系とXilinx系)のいずれかを選択して実験環境の構築を行う。利用可能な回路ライブラリが十分に揃っていないため、独自の専用回路を設計する予定。ただし、新規の回路アーキテクチャをFPGAに実装することが困難な場合は、仮想的なモデルについて数値シミュレーションにより性能評価を行う予定である。
|
次年度使用額が生じた理由 |
技術革新が著しく、当初に並列計算専用ハードウェアとして購入を予定していたGPUカードの技術の陳腐化、深層学習の計算に特化した新技術のTensorCoreの商用化、CUDAを採用した大規模クラウドサービスの商用化、さらに全く異なる新技術のFPGAアクセラレーション・カードの商用化、等の最新システムの激変に対応して計画を修正した。ただし、新技術のため、動作検証が完了したホストコンピュータが高価格品に限定されているなど、購入機種の選定において制約が多く、仕様の決定に時間を要したが、廉価版カードを用いた予備検証結果をもとに、近日中に購入手続きを進める予定である。
|