研究課題/領域番号 |
23240002
|
研究機関 | 東京大学 |
研究代表者 |
定兼 邦彦 東京大学, 情報理工学(系)研究科, 教授 (20323090)
|
研究分担者 |
渋谷 哲朗 東京大学, 医科学研究所, 准教授 (60396893)
福永 ALEX 東京大学, 総合文化研究科, 准教授 (90452002)
胡 振江 国立情報学研究所, アーキテクチャ科学研究系, 教授 (50292769)
|
研究期間 (年度) |
2011-04-01 – 2015-03-31
|
キーワード | メニーコア / GPGPU / MapReduce / 並列アルゴリズム / 省スペースアルゴリズム |
研究実績の概要 |
計算機の動作周波数の向上は限界に来ており,並列アーキテクチャの必要性が増加している.中でも,グラフィック処理のための専用プロセッサとして開発されたGPU を,その高い並列性を活かしてグラフィック処理以外の汎用の処理に用いるGPGPU は,安価かつ省電力で超並列環境を構築できることから注目されている.アーキテクチャに共通する特徴を元にアルゴリズムの計算時間の上界または下界を知ることは,アルゴリズムを設計する上で役に立つ.本研究では,GPGPUのための汎用計算モデルがAGPUモデルを提案する.AGPUモデルを用いてGPU アルゴリズムの計算量を解析することで,どのようなアルゴリズムがGPU に適しているかを判定できる. まず,既存の並列ソートアルゴリズムの計算量の解析を行った.バイトニックソートの時間計算量は O(n log^2 n / p) である(n はデータ数,p はプロセッサ数).メモリアクセスの効率を測るI/O計算量は O(n/b (log_{Mb/p} n)^2) である (M, b はGPUアーキテクチャのパラメタ).また,GPU-warpsortの時間,I/O計算量はそれぞれ O(n/b log n/b),O(n/p log n/b log b) である.また,AGPUモデルでのI/O計算量の下界を求めた.それは Ω(n/b log_{M/p} n/b) であり,既存のアルゴリズムのI/O計算量は最適では無いことを示した. 次に,I/O計算量が最適な新しい並列ソートアルゴリズムを開発した.時間計算量は O(n/p log n/b log b) であり,ほぼ最適である.実際のGPUを用いた実験を行い,提案アルゴリズムがGPU-warpsortよりも1.9倍高速になることを示した.このように,GPU用の計算モデルを定義することで,既存アルゴリズムの解析を行い,そのボトルネックを発見し,新しいアルゴリズムの開発に生かすことができるようになった.
|
現在までの達成度 (段落) |
26年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
26年度が最終年度であるため、記入しない。
|