2014 Fiscal Year Annual Research Report
Project/Area Number |
23240002
|
Research Institution | The University of Tokyo |
Principal Investigator |
定兼 邦彦 東京大学, 情報理工学(系)研究科, 教授 (20323090)
|
Co-Investigator(Kenkyū-buntansha) |
渋谷 哲朗 東京大学, 医科学研究所, 准教授 (60396893)
福永 ALEX 東京大学, 総合文化研究科, 准教授 (90452002)
胡 振江 国立情報学研究所, アーキテクチャ科学研究系, 教授 (50292769)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | メニーコア / GPGPU / MapReduce / 並列アルゴリズム / 省スペースアルゴリズム |
Outline of Annual Research Achievements |
計算機の動作周波数の向上は限界に来ており,並列アーキテクチャの必要性が増加している.中でも,グラフィック処理のための専用プロセッサとして開発されたGPU を,その高い並列性を活かしてグラフィック処理以外の汎用の処理に用いるGPGPU は,安価かつ省電力で超並列環境を構築できることから注目されている.アーキテクチャに共通する特徴を元にアルゴリズムの計算時間の上界または下界を知ることは,アルゴリズムを設計する上で役に立つ.本研究では,GPGPUのための汎用計算モデルがAGPUモデルを提案する.AGPUモデルを用いてGPU アルゴリズムの計算量を解析することで,どのようなアルゴリズムがGPU に適しているかを判定できる. まず,既存の並列ソートアルゴリズムの計算量の解析を行った.バイトニックソートの時間計算量は O(n log^2 n / p) である(n はデータ数,p はプロセッサ数).メモリアクセスの効率を測るI/O計算量は O(n/b (log_{Mb/p} n)^2) である (M, b はGPUアーキテクチャのパラメタ).また,GPU-warpsortの時間,I/O計算量はそれぞれ O(n/b log n/b),O(n/p log n/b log b) である.また,AGPUモデルでのI/O計算量の下界を求めた.それは Ω(n/b log_{M/p} n/b) であり,既存のアルゴリズムのI/O計算量は最適では無いことを示した. 次に,I/O計算量が最適な新しい並列ソートアルゴリズムを開発した.時間計算量は O(n/p log n/b log b) であり,ほぼ最適である.実際のGPUを用いた実験を行い,提案アルゴリズムがGPU-warpsortよりも1.9倍高速になることを示した.このように,GPU用の計算モデルを定義することで,既存アルゴリズムの解析を行い,そのボトルネックを発見し,新しいアルゴリズムの開発に生かすことができるようになった.
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
[Presentation] Canadians Should Travel Randomly2014
Author(s)
Erik D. Demaine, Yamming Huang, Chung-Shou Liao, Kunihiko Sadakane
Organizer
41st International Colloquium on Automata, Languages and Programming (ICALP)
Place of Presentation
IT University of Copenhagen (コペンハーゲン,デンマーク)
Year and Date
2014-07-07 – 2014-07-11
-
-
-