• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用

研究課題

研究課題/領域番号 15H02709
研究機関国立研究開発法人理化学研究所

研究代表者

今村 俊幸  国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)

研究分担者 大井 祥栄  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (10721045)
深谷 猛  北海道大学, 学内共同利用施設等, 助教 (30633846)
廣田 悠輔  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (60709765)
椋木 大地  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (90742289)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード非同期アルゴリズム / 超メニイコア / スケーラブル / 自動チューニング / 通信同期回避 / 時間方向離散 / 異粒度数値カーネル
研究実績の概要

本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき早期に実現することを目的にし、「異粒度数値カーネル構築」と共に「非同期的な数値計算アルゴリズム」の2大テーマのもと、1)非同期的数値計算アルゴリズムの理論、2) 超メニイコアでのスケーラブルな軽量コード生成のための自動チューニング・通信同期回避技術などの核基盤技術の研究により次世代数値計算ソフトウェアの新技術創出に繋がる新機軸探究を進める。
2015年度は、非同期アルゴリズムの理論的研究のスタートアップとして、非同期アルゴリズムの理解のための予備調査と呼び実装を中心に実施した。主な成果は以下のようになる。1)【廣田・大井】による 非同期アルゴリズムの理論的研究の予備的な調査に関して、非同期型数値計算アルゴリズムと時間方向離散化手法の非同期原理の研究、2)【今村・深谷】による既存の非同期アルゴリズムや関連アルゴリズムの分析と拡張、3)【今村・椋木】による非同期アルゴリズム構築に必要なコンパクトなカーネル生成技術の研究

具体的には1)ではEdmond Chowの非同期LU分解とそれ以前に存在したJacobi/Gauss-Seidel型混合の定常反復型スキームについて、それらアルゴリズムのデータ依存関係と選択条件などを中心にしたアルゴリズム構成の一般化を議論した。非同期型1つの凡例化の可能性をある程度見出すきっかけとなる事例分析はできたと考えられる。また、2)では通信発行回数を2/5程度に削減する通信回避型アルゴリズムを実装し、固有値ソルバーにおいておよそ20%程度の計算時間削減に成功している。

など、当初の研究計画に従って設定した予備調査としては一定以上の成果が得られている。初年度の課題遂行は順調と判断される。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

非同期LU分解とそれ以前に存在したJacobi/Gauss-Seidel型混合の定常反復型スキームについて、それらアルゴリズムのデータ依存関係と選択条件などを中心にしたアルゴリズム構成の一般化を議論した。非同期型1つの凡例化の可能性をある程度見出すきっかけとなる事例分析はできたと考えられる。
また、代表者が従来から開発している固有値ソルバーにおいて通信回避型の新規アルゴリズムを採用することにより、通信オーバヘッドの削減により、全体で20%程度の時間削減が大成されるなど、非同期もしくはそれに関連する技術に対して一定の効果を認める研究成果も得られており、国際会議においても成果を発表できている。
さらに、GPU上のコンパクトなカーネル生産技術の研究では、GPUにおけるマルチスレッディング動作をモデル化することで,プログラムを実行する状況に応じて適切なスレッドブロックサイズを自動的に決定する方法を提案もなされ、次年度に成果報告を予定できている。
なお、当該年度において購入を予定していたメニイコアサーバ等がベンダーの開発遅延により実施できず、実機による実験のための環境整備ができていない点が次年度以降の研究遂行において問題となる可能性がある。

今後の研究の推進方策

初年度実施した予備調査の成果をもとに、本研究課題が目指す非同期的な数値アルゴリズムの具体化とともに、それをコンピュータ実機上で実現するための環境整備を実施する。なお、サーバー導入が初年度にできなかった点は、市場の動向に合わせて適切な規模のサーバーの導入もしくは各情報基盤センター等の導入新機種の共同利用契約により研究の遅延が発生しないように進めていく。

  • 研究成果

    (12件)

すべて 2016 2015

すべて 雑誌論文 (3件) (うち査読あり 1件、 謝辞記載あり 3件) 学会発表 (9件) (うち国際学会 3件、 招待講演 2件)

  • [雑誌論文] CAHTR: Communication-Avoiding Householder Tridiagonalization2016

    • 著者名/発表者名
      Toshiyuki Imamura, Takeshi Fukaya, Yusuke Hirota, Susumu Yamada, Masahiko Machida
    • 雑誌名

      Advances in Parallel Computing

      巻: 27 ページ: 381, 390

    • DOI

      10.3233/978-1-61499-621-7-381

    • 査読あり / 謝辞記載あり
  • [雑誌論文] NVIDIA GPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法2015

    • 著者名/発表者名
      椋木大地,今村俊幸,高橋大介
    • 雑誌名

      情報処理学会研究報告

      巻: 2015-HPC-150, No.13 ページ: 1,13

    • 謝辞記載あり
  • [雑誌論文] SYMV・GEMVルーチン群のマルチGPU化とその評価2015

    • 著者名/発表者名
      今村俊幸, 椋木大地, 山田進, 町田昌彦
    • 雑誌名

      情報処理学会研究報告

      巻: 2015-HPC-151, Vol.13 ページ: 1,8

    • 謝辞記載あり
  • [学会発表] Performance Analysis of the Householder Back-transformation with Asynchronous Collective Communication2016

    • 著者名/発表者名
      Toshiyuki Imamura
    • 学会等名
      2015 SIAM Conference on Applied Linear Algebra
    • 発表場所
      Hyatt Regency Atlanta, US
    • 年月日
      2016-10-26
    • 国際学会
  • [学会発表] Automatic Thread-Block Size Adjustment for Dense Matrix-Vector Multiplication on CUDA2016

    • 著者名/発表者名
      Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi
    • 学会等名
      Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • 発表場所
      National Taiwan University
    • 年月日
      2016-02-19 – 2016-02-20
    • 国際学会 / 招待講演
  • [学会発表] Present and Future of the EigenExa library2016

    • 著者名/発表者名
      Toshiyuki Imamura
    • 学会等名
      Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • 発表場所
      National Taiwan University
    • 年月日
      2016-02-19 – 2016-02-20
    • 国際学会 / 招待講演
  • [学会発表] Performance Evaluation of Verified Computation for Linear Systems on Parallel Computers2016

    • 著者名/発表者名
      Yusuke Morikura, Daichi Mukunoki, Takeshi Fukaya, Naoya Yamanaka, Shin’ichi Oishi
    • 学会等名
      2nd Annual Meeting on Advanced Computing System and Infrastructure (ACSI2016)
    • 発表場所
      九州大学医学部百年講堂
    • 年月日
      2016-01-19
  • [学会発表] 非同期的な数学的アルゴリズムのソフトウェアの可能性2015

    • 著者名/発表者名
      今村俊幸
    • 学会等名
      第7回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2015)
    • 発表場所
      東京大学山上会館
    • 年月日
      2015-12-25
  • [学会発表] 非同期アルゴリズムの類型とメニーコアプロセッサ向け同期削減技術の開発2015

    • 著者名/発表者名
      廣田悠輔,今村俊幸
    • 学会等名
      平成27年度自動チューニング研究会マイクロワークショップ
    • 発表場所
      KKR甲府、甲府市
    • 年月日
      2015-10-19
  • [学会発表] 時間並列計算 -Parareal in time algorithm-2015

    • 著者名/発表者名
      大井祥栄
    • 学会等名
      平成27年度自動チューニング研究会マイクロワークショップ
    • 発表場所
      KKR甲府、甲府市
    • 年月日
      2015-10-19
  • [学会発表] O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用2015

    • 著者名/発表者名
      今村俊幸
    • 学会等名
      平成27年度自動チューニング研究会マイクロワークショップ
    • 発表場所
      KKR甲府、甲府市
    • 年月日
      2015-10-19
  • [学会発表] GPUにおけるスレッド数自動選択機能を持ったメモリ律速な線形計算カーネル群「MUBLAS」の実装と評価2015

    • 著者名/発表者名
      椋木大地,今村俊幸,高橋大介
    • 学会等名
      GTC Japan 2015
    • 発表場所
      虎ノ門ヒルズフォーラム
    • 年月日
      2015-09-18

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi