2011 Fiscal Year Research-status Report

進化計算の高速化を実現するＧＰＧＰＵ基盤ソフトウェアの開発

Research Project

Project/Area Number	23500285
Research Institution	Osaka Prefecture University
Principal Investigator	藤本典幸大阪府立大学, 理学(系)研究科(研究院), 教授 (90294165)
Project Period (FY)	2011-04-28 – 2014-03-31
Keywords	アルゴリズム / 超高速情報処理 / ソフトコンピューティング / 並列処理 / GPGPU
Research Abstract	本研究の目的は，現在注目されており将来も有望な並列計算プラットフォームであるGPUを用いて，様々な問題に応用できる進化計算を高速に実行するための一般的手法・方法論を世界に先駆けて開発することである．進化計算は，個体の集団に対して操作を繰り返して解を探索するアルゴリズムの総称であり，遺伝アルゴリズムなど，いくつかの手法がある．ところで遺伝アルゴリズムは，解候補を表現する複数の個体に遺伝的操作を施すことを繰り返すアルゴリズムであり，各個体に対する処理は独立であるので，個体処理間に自明な並列性がある．しかし，２次割当て問題や巡回セールスマン問題などの，多くの問題で用いられる個体数は，局所探索を併用する性能のよい遺伝アルゴリズムの場合は，数十から数百程度である．このため1個体の処理を1スレッドで実行する単純な並列化を行うと，遺伝アルゴリズム全体で用いるスレッド数が高々数十から数百程度で抑えられてしまうが，これではCUDA対応GPUが必要とする数万スレッドに満たない．このため，GPUは価格性能比が非常によい魅力的な計算プラットフォームとして現在注目されているが，進化計算についてはGPUを単純に適用することが難しい．　そこで平成23年度は，まず，個体処理間の並列性の利用に加えて，1個体の処理内の並列性も引き出し，遺伝アルゴリズム全体を高い並列度で並列処理するための手法の研究を行った．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 最適割当て問題の中で最も困難な問題の一つである2次割当て問題の高速解法にGPUを適用する方法の研究を進めている．2次割当て問題は，TSPと同様，組合せ最適化問題の解法におけるベンチマーク問題として用いられるとともに，病院の部署の最適配置問題や工場の最適立地計画問題など実問題への多くの応用があり，その高速解法は有用な意味を持つ．この解法においては，進化計算と局所探索とを組合せることが有効であることが知られている．今年度はACO（Ant Colony Optimization）に局所探索（2-opt，タブー探索）を組合せてGPUで高速に解く方法を研究した．ここでは特にGPUのマルチスレッド方式であるSIMT (Single Instruction, Multiple Thread) を考慮した方式を提案した．成果に関しては国際会議 CEC-2011 [1]，GECCO-2011 [2]で報告した．[1] S. Tsutsui, N. Fujimoto. Fast QAP Solving by ACO with 2-opt Local Search on a GPU. the IEEE Congress on Evolutionary Computation. IEEE, pp. 812-819, June 2011.[2] S. Tsutsui, N. Fujimoto. ACO with Tabu Search on a GPU for Solving QAPs using Move-Cost Adjusted Thread Assignment. the Genetic and Evolutionary Computation Conference. ACM, pp. 1547-1554, July 2011.
Strategy for Future Research Activity	GPU利用の成功事例が多数報告されている数値計算などのアルゴリズムでは大規模な配列データへのアクセスパターンは静的に決まっているか，動的に決まるとしてもランダム性はない．このため共有メモリやキャッシュメモリの利用が比較的容易である．これに対して遺伝アルゴリズムでは，多数の個体の遺伝情報を記憶した大規模な配列に対するアクセスパターンが動的かつランダムに決まる．このため遺伝アルゴリズムではGPUのキャッシュメモリや共有メモリの有効利用はチャレンジングな課題となる．　そこで今後は，大規模な配列データへのランダムアクセスを高速化するソフトウェアキャッシュ手法の開発を行う．大規模配列データはVRAM上に配置せざるを得ないが，参照の局所性の高い部分を各マルチプロセッサの共有メモリに動的にロードする手法（ソフトウェアキャッシュ）を用意できれば，遺伝アルゴリズム全体の実行を大幅に高速化できると考えられる．GPUのVRAMと共有メモリにはコアレスアクセスやバンク衝突と呼ばれる性能特性があるため，このソフトウェアキャッシュ手法の開発はチャレンジングな課題となる．
Expenditure Plans for the Next FY Research Funding	昨年度使用額が23万円強残った理由は，当該年度に発売されるはずであった新アーキテクチャのGPUが，半導体製造技術のプロセスルール微細化のスケジュールの遅れにより，次年度の持ち越されたためである．　GPUの性能向上は著しい（１年～１年半に１回程度，性能が大きく向上した新しいGPUが製品化される）ため，研究を効果的に進めるためには，最新のGPUを備えた計算機が必要である．特に今年度はGPUのアーキテクチャが刷新される年度であり，4月に新アーキテクチャに基づくGPUのミドルクラス製品が発売済み，6月にはハイエンド製品が発売される予定である．このためGPU計算サーバ１台を購入予定である．　GPUを用いた汎用計算は，ここ数年の間に立ち上がった新しいテーマであるので，研究を効果的に進めるためには学会に参加しての他の研究者と直接交流による情報収集が必須である．このため研究成果発表に加えて情報収集のための国内および海外出張をそれぞれ３回および２回程度行う予定である．　開発したGPUプログラムの性能評価を行う際には，他のGPUプログラムとの比較はもちろんのことであるが，それに加えて，できるだけ性能のよいCPUプログラムとの比較も行うべきであるため，CPU用の高性能な目的プログラムを生成するIntelコンパイラの年間利用ライセンスを購入予定である．

Research Products
(10 results)

All 2012 2011

All Journal Article (6 results) (of which Peer Reviewed: 6 results) Presentation (4 results)

[Journal Article] GPUを使用したビット並列アルゴリズムに基く最長共通部分列の導出2011
- Author(s)
  河南克也,藤本典幸
- Journal Title
  
  第９回先進的計算基盤システムシンポジウム(SACSIS)論文集
  
  Volume: 1 Pages: 1-8
- Peer Reviewed
[Journal Article] Fast QAP Solving by ACO with 2-opt Local Search on a GPU2011
- Author(s)
  Shigeyoshi Tsutsui, Noriyuki Fujimoto
- Journal Title
  
  the 2011 IEEE Congress on Evolutionary Computation (CEC)
  
  Volume: 1 Pages: 812-819
- Peer Reviewed
[Journal Article] ACO with Tabu Search on a GPU for Solving QAPs using Move-Cost Adjusted Thread Assignment2011
- Author(s)
  Shigeyoshi Tsutsui, Noriyuki Fujimoto
- Journal Title
  
  the Genetic and Evolutionary Computation Conference (GECCO)
  
  Volume: 1 Pages: 1547-1554
- Peer Reviewed
[Journal Article] Parallelizing fuzzy rule generation using GPGPU2011
- Author(s)
  Takesuke Uenishi, Tomoharu Nakashima, Noriyuki Fujimoto
- Journal Title
  
  Artificial Life and Robotics
  
  Volume: 16 Pages: 214-218
- Peer Reviewed
[Journal Article] Economical Two-foldWorking Precision Matrix Multiplication on Consumer-Level CUDA GPUs2011
- Author(s)
  Noriyuki Fujimoto
- Journal Title
  
  International Symposium on Computer Architecture and High Performance Computing Workshops (SBAC-PADW)
  
  Volume: 1 Pages: 1-6
- Peer Reviewed
[Journal Article] GPUを用いたN-Queens問題の求解2011
- Author(s)
  田中慶悟,藤本典幸
- Journal Title
  
  ゲームプログラミングワークショップ 2011論文集
  
  Volume: 1 Pages: 76-83
- Peer Reviewed
[Presentation] 対称解の特性を用いたN-Queens問題の求解とGPUによる高速化2012
- Author(s)
  萩野谷一二,田中慶悟,藤本典幸
- Organizer
  第27回ゲーム情報学研究会
- Place of Presentation
  東京
- Year and Date
  2012年3月2日
[Presentation] 最長共通部分列を求めるビット並列アルゴリズムのCUDAによる高速化2011
- Author(s)
  藤本典幸
- Organizer
  GTC Workshop Japan 2011
- Place of Presentation
  東京
- Year and Date
  2011年7月22日
[Presentation] HOG特徴量を用いた動画からの人検出のGPUによる高速化2011
- Author(s)
  藤本典幸
- Organizer
  GTC Workshop Japan 2011
- Place of Presentation
  東京
- Year and Date
  2011年7月22日
[Presentation] SATアルゴリズムにおけるBCP処理のGPUを用いた並列化2011
- Author(s)
  藤井宏憲,藤本典幸
- Organizer
  第189回ARC・第132回HPC合同研究発表会（HOKKE-19）
- Place of Presentation
  札幌
- Year and Date
  2011年11月29日

2011 Fiscal Year Research-status Report

進化計算の高速化を実現するＧＰＧＰＵ基盤ソフトウェアの開発

Principal Investigator

藤本 典幸 大阪府立大学, 理学(系)研究科(研究院), 教授 (90294165)

Current Status of Research Progress

Reason

Research Products

[Journal Article] GPUを使用したビット並列アルゴリズムに基く最長共通部分列の導出2011

Author(s)

Journal Title

[Journal Article] Fast QAP Solving by ACO with 2-opt Local Search on a GPU2011

Author(s)

Journal Title

[Journal Article] ACO with Tabu Search on a GPU for Solving QAPs using Move-Cost Adjusted Thread Assignment2011

Author(s)

Journal Title

[Journal Article] Parallelizing fuzzy rule generation using GPGPU2011

Author(s)

Journal Title

[Journal Article] Economical Two-foldWorking Precision Matrix Multiplication on Consumer-Level CUDA GPUs2011

Author(s)

Journal Title

[Journal Article] GPUを用いたN-Queens問題の求解2011

Author(s)

Journal Title

[Presentation] 対称解の特性を用いたN-Queens問題の求解とGPUによる高速化2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 最長共通部分列を求めるビット並列アルゴリズムのCUDAによる高速化2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] HOG特徴量を用いた動画からの人検出のGPUによる高速化2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] SATアルゴリズムにおけるBCP処理のGPUを用いた並列化2011

Author(s)

Organizer

Place of Presentation

Year and Date

藤本典幸大阪府立大学, 理学(系)研究科(研究院), 教授 (90294165)