2015 Fiscal Year Annual Research Report
1万コア以上を用いる並列探索アルゴリズムで囲碁名人に勝つ
Project/Area Number |
25700038
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
美添 一樹 東京工業大学, 大学院情報理工学研究科, 東工大特別研究員 (80449115)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | ゲームプログラミング / 並列計算 / 探索 / 人工知能 / 囲碁 / 深層学習 |
Outline of Annual Research Achievements |
2016年3月に、Google DeepMind 社による囲碁プログラム AlphaGo が元囲碁世界王者に勝利した。これはモンテカルロ木探索と深層学習の組合せによってなされている。本研究課題のタイトルにある囲碁名人に勝利するという目標は、既に他者によって達成されたことになる。上記の出来事以前から、深層学習の有効性が明らかになりつつあり、昨年度は当初の計画をかなり変更し、研究時間の多くを深層学習に充てた。深層学習の探索への応用に関してはまだ研究途上である。取り組んだテーマは (1) 深層学習の学習アルゴリズムの大規模並列化、(2) 深層学習と探索アルゴリズムの組合せ、である。 上記に加えて、引き続き並列探索の他分野への応用に取り組んだ。数値制約充足問題の並列化の学会発表に続き、類似技術を連続最適化へ応用した。また、頻出アイテム集合の列挙を大規模並列化し(これは2部グラフ極大クリーク列挙と等価)さらに多重検定アルゴリズムへ応用した。これらは深さ優先探索アルゴリズムを大規模並列化したものである。 さらにこれまでに得られた探索の並列化に関する成果を並列探索ライブラリとして提供することを目指して開発を開始している。具体的には、探索アルゴリズムの並列化を以下の3つのケースに分類し、それぞれに対するライブラリを作成する予定である。(1) 深さ優先探索のスタック化による並列化:頻出アイテム集合検出、数値制約充足問題など、(2) ハッシュ表を利用した探索アルゴリズムの分散ハッシュ表による並列化: 反復進化A*探索、モンテカルロ木探索など、(3) 優先度付きキューを利用した探索アルゴリズムの分散キューによる並列化: ダイクストラのアルゴリズム、A*探索など。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
AlphaGo が公に明らかになったのは3月だが、実際には昨年度の早い時期から、深層学習の予想以上の有効性が判明しつつあり、深層学習の比重を高める方向に研究計画を大きく変更した。そのために研究の様々な部分に影響が出た。GPUを複数搭載したワークステーションの選定、購入など、及び新たに深層学習の理論と実践のノウハウを身につけることにかなりの時間を要した。 逆に、昨年度当初計画していた対故障性に関する部分は先送りする方針としたため、対故障性に関しては進捗がない状態であり、遅れていると言える。
|
Strategy for Future Research Activity |
上述の内容を踏まえて、最終年度は主に、1, 深層学習と探索の組合せ、2, 複数の問題への並列探索の応用、3, 並列探索ライブラリの作成、4, AlphaGo の結果の再現、を計画している。 1, 深層学習と探索の組合せ: 既に昨年度から深層学習の研究に取り組んでいる。モンテカルロ木探索の弱点を補う手法として、深層学習との組合せが有望であることがAlphaGo の結果から推測される。本年度は深層学習を応用した並列探索の研究に取り組む。これはGPUを探索アルゴリズムに利用することにもなる。今まで探索アルゴリズムにGPUが用いられた例は少なく、省電力の観点からも重要なテーマである。 2, 複数の問題への並列探索の応用: 数値制約充足問題には既に昨年度までに応用を試み、成果を上げているが今年度も引き続き、類似した問題に応用を試みる予定である。複雑な連続最適化問題が有力な候補である。昨年度新たに並列探索を応用した頻出集合列挙および多重検定についても引き続き取り組む予定である。さらに最大クリーク列挙などへの応用も準備中である。3, 並列探索ライブラリの作成: 複数の問題への応用から、並列探索に共通して必要な要素をライブラリ化し、公開することを目指す。並列探索の実装に必要な労力は依然として大きく、それを軽減することは重要なテーマである。4, AlphaGo の再現実験: 既に他者による論文発表がなされているために通常の研究目標とは異なるが、本年度はAlphaGoの論文の結果の再現にも取り組む予定である。
|
Causes of Carryover |
深層学習の研究の比重が当初の想定よりも大幅に高くなったために、想定通りに研究が進まなかったため。
|
Expenditure Plan for Carryover Budget |
深層学習に適したハードウェアの追加購入およびスーパーコンピュータの利用料などに使用する予定である。
|
Research Products
(4 results)