研究課題/領域番号 |
25700038
|
研究機関 | 東京工業大学 |
研究代表者 |
美添 一樹 東京工業大学, 情報理工学(系)研究科, 東工大特別研究員 (80449115)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | ゲームプログラミング / 並列計算 / 探索 / 人工知能 / 囲碁 |
研究実績の概要 |
引き続き計画通りモンテカルロ木探索の大規模並列化の研究を行い、特に囲碁で高い性能を出すことを目標としているが、ゲーム以外への分野への応用も目的としている。2013年度までの研究で並列探索アルゴリズムの大枠は既に提案済みであったが、2014年度のアルゴリズム自体の実績としては主に (1) 探索時間が短い場合の性能向上、(2) パラメータの動的変更の枠組みの用意を達成した。また、他の分野への応用として、(3) 数値制約充足問題 (NCSP) のソルバの大規模並列化を行った。 (1) 与えられた計算時間が短い場合、特に並列度が高くなると、性能向上が頭打ちになることは判明していた。総計算時間が短い場合、当然ながら情報の更新の頻度をより高める必要があるが、大きな通信オーバーヘッド無しにこれを行うことが難点であった。2014年度にはこの問題の解消のために、2013年度までに提案済みの並列探索アルゴリズムに大きく変更を加え、通信負荷を押さえたまま情報の更新の頻度を高める方法を提案した(投稿準備中)。 (2) 木探索の場合、探索木の形状などによってアルゴリズムの速度性能が大きな影響を受ける。もし事前に探索木の性質が判明していればそれに応じてパラメータを調整することが可能だが、実際には探索を始めるまでは性質が分からないことが多い。そこで、探索中にアルゴリズムのパラメータを変更することが考えられる。2014年度の成果として、予備実験によりアルゴリズムのパラメータは比較的単純なパラメータ数個に着目して調整することが有望であることが判明した。 (3) 数値制約充足問題のソルバを並列化する研究は2013年度から開始していた。2013年度の実験で既に256コアを用いて119倍の速度向上を達成していたが、2014年度はさらに性能を向上させ、東工大TSUBAMEの600コアを用いて最大で500倍以上の速度向上を達成した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
上述のように計算時間が短い場合の性能向上、パラメータの動的調整の用意、数値制約充足問題の大規模並列化を達成した。しかし以下に挙げたその他の目標の達成が遅れている。 (1) 耐故障性の獲得、(2) モンテカルロ木探索の弱点を補うことによる汎用性の向上、(3) 強い囲碁プログラムの作成による成果の発信 遅れの主たる理由は、並列探索に伴うシステム上の問題の解決に予想よりも時間がかかったこと、および研究代表者が内臓疾患の治療のために手術を受けたことによる作業時間の減少である。特に、当初の研究計画にはなかった耐故障性の獲得については新たに既存研究のサーベイなどから開始する必要があったため、作業時間の減少の影響を大きく受けている。
|
今後の研究の推進方策 |
2014年度当初にはモンテカルロ木探索の大規模並列化に関して5つの目標を上げたが、そのうち3つは未解決のまま残っている。具体的には以下の5つの目標を上げた。(1) 耐故障性の獲得、(2) 短時間の探索での性能向上、(3) モンテカルロ木探索の弱点を補う、(4)パラメータの動的変更、(5) 強い囲碁プログラムの作成。これらの中で、(2) と (4) は実現し、論文投稿の準備中である。また上記の目標には含まれていないが、モンテカルロ木探索の並列化で培った並列探索の知見を応用し、数値制約充足問題を並列計算機で高速に解くことに成功した。2015年度は残りの(1)、(3)、(5) の3つを含めた課題の解決を目指す。 特に重視する物は (3) モンテカルロ木探索の弱点を補うことである。モンテカルロ木探索は確率的なアルゴリズムであるために、特定の形状をした探索木を苦手とする弱点がある。具体的には正解の存在する部分への探索経路の数が非常に少ない場合、を苦手とする。例えば囲碁ではゲームの性質を知る人間が工夫を加えて弱点を補っているが、人間の手によるヒューリスティック以外の方法で解決することを目指す。具体的にはAND/OR木探索との組合せが有望である。 (1) の耐故障性は古くからある問題であり既存研究も様々に存在するが、本研究では過去の研究と比較すると異なる点がある。難点としては、故障の検知および回避を非常に短時間で行う必要があり、また容易な点としては故障の発生への対応は必要だが、新たな計算機の追加などへの対応は(当面は)不要であることがある。 さらに当初は目的に含まれていなかったが、 Deep learning を探索に応用することを目指す。 これらの目標の実現により、目標「(5) 強い囲碁プログラムの作成」を達成することを目指す。
|
次年度使用額が生じた理由 |
円安の影響で計算機の価格が高騰し、調達の計画に変更が必要であったため。
|
次年度使用額の使用計画 |
主にスーパーコンピュータの使用料、および実験用クラスタの拡充に用いる予定である。
|