• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

メモリマシンモデル上の並列計算理論の構築と次世代GPGPUアーキテクチャの提案

研究課題

研究課題/領域番号 26280002
研究機関広島大学

研究代表者

中野 浩嗣  広島大学, 工学研究科, 教授 (30281075)

研究分担者 高藤 大介  広島大学, 工学研究科, 助教 (00314732)
伊藤 靖朗  広島大学, 工学研究科, 准教授 (40397964)
研究期間 (年度) 2014-04-01 – 2019-03-31
キーワード並列処理 / 理論計算モデル / 並列アルゴリズム
研究実績の概要

これまでのGPGPUの理論的解析の結果,本年度は主に2つの研究成果を得た.
(1)一昨年度に,LZW可逆圧縮法のための超並列アルゴリズムの発見とGPUへの効率的な実装方法を示し,昨年度は,圧縮率や展開速度の優れたLLL(Light Loss Less)と呼ぶデータ可逆圧縮手法を示した.本年度はさらにそれを進め,ALL(Adaptive Loss Less)と呼ぶ新しいデータ可逆圧縮法を示した.そのアイデアは,元データに存在する繰り返しを求め,その部分をmagic stringとして保存しておく点にある. GPUへの実装実験を行い,圧縮率・処理時間ともに従来手法を大きく改善していることが示せた.GPUで何らかのデータ処理を行う場合は,あらかじめALL圧縮を用いておくことにより,GPUによる展開のための処理時間を含めても,ホストGPU間の転送時間が短縮できることになり,多くのアプリケーションへの適用が期待できる.
(2)我々が提案するBPBC(Bitwise Parallel Bulk Computation)手法の発見とGPUへの効率的な実装方法.多くのプロセッサがサポートしているビットワイズ演算を用いて,大量の論理回路のシミュレーションが同時にかつ高速に行えることを理論的に示したが,これを文脈自由文法のCKYパージングに適用できることを示した.具体的には,文脈自由文法に依存してパージングを行う組み合わせ回路を生成し,そのシミュレーションをGPUで行うことにより,高速化を達成した.計算機実験によりその高速性を実証した. BPBC手法は究極のビットレベル高並列化を行うものであり,GPUに適した手法であるとともに,さまざまな幅広い応用が考えられる.
これらの手法は,本研究の主題であるGPUの理論的モデルを用いて解析的評価を行っており,GPUでの評価実験結果が合致することも示した.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

今年度は次の内容を査読付き学術雑誌論文に発表することができた.(1)GPU上でlocal exhaustive searchを用いることによるデジタルハーフトニング手法の高速化 (2) 逐次アルゴリズムを自動的にGPU向けのCUDAプログラムに変換するツール(3)GPUによる究極の性能を実現するALL(Adaptive Loss Less)可逆圧縮法(4)BPBC(Bitwise Parallel Bulk Computation)手法を用いて文脈自由文法のCKYパージングを行うGPU向け並列アルゴリズム(5)コラッツ予想のしらみつぶし解法を行うGPU向け並列アルゴリズム(6)大量の行列の固有値を並列に求めるGPU実装.
よって,予想以上の研究成果が得られている.

今後の研究の推進方策

GPUのキラーアプリケーションはディープラーニングであり,さまざまな人工知能アプリケーションが開発されている.今後は,GPUの理論モデルをベースにディープラーニングの究極の高速化の実現を目指す.ディープラーニングでは畳み込み演算が繰り返し行うが,その計算量の圧縮やBPBC(Bitwise Parallel Bulk Computation)手法を用いた高速化について検討しGPU実装を行い,有効性の実証を目標に研究を進める.

次年度使用額が生じた理由

2017年度中に購入予定であったGPUボードが他の予算で購入可能であったため.
2018年度中に発売されるアクセラレータボードの購入に使用予定である.

  • 研究成果

    (14件)

すべて 2017 その他

すべて 国際共同研究 (1件) 雑誌論文 (6件) (うち国際共著 2件、 査読あり 6件、 オープンアクセス 1件) 学会発表 (7件) (うち国際学会 7件)

  • [国際共同研究] ブラジリア大学(ブラジル)

    • 国名
      ブラジル
    • 外国機関名
      ブラジリア大学
  • [雑誌論文] Accelerating digital halftoning using the local exhaustive search on the GPU2017

    • 著者名/発表者名
      Hiroaki Kouge, Takumi Honda, Toru Fujita, Yasuaki Ito, Koji Nakano, Jacir Luiz Bordim
    • 雑誌名

      Concurrency and Computation: Practice and Experience

      巻: 29 ページ: e3781

    • DOI

      https://doi.org/10.1002/cpe.3781

    • 査読あり / 国際共著
  • [雑誌論文] C2CU: a CUDA C program generator for bulk execution of a sequential algorithm2017

    • 著者名/発表者名
      Daisuke Takafuji, Koji Nakano, Yasuaki Ito, Jacir Luiz Bordim
    • 雑誌名

      Concurrency and Computation: Practice and Experience

      巻: 29 ページ: e4022

    • DOI

      https://doi.org/10.1002/cpe.4022

    • 査読あり / 国際共著
  • [雑誌論文] Adaptive loss-less data compression method optimized for GPU decompression2017

    • 著者名/発表者名
      Shunji Funasaka, Koji Nakano, Yasuaki Ito:
    • 雑誌名

      Concurrency and Computation: Practice and Experience

      巻: 29 ページ: e4283

    • DOI

      https://doi.org/10.1002/cpe.4283

    • 査読あり
  • [雑誌論文] An Efficient GPU Implementation of CKY Parsing Using the Bitwise Parallel Bulk Computation Technique2017

    • 著者名/発表者名
      Toru Fujita, Koji Nakano, Yasuaki Ito, Daisuke Takafuji
    • 雑誌名

      IEICE TRANSACTIONS on Information and Systems

      巻: E100-D ページ: 2857-2865

    • DOI

      https://doi.org/10.1587/transinf.2017PAP0018

    • 査読あり
  • [雑誌論文] GPU-accelerated Exhaustive Verification of the Collatz Conjecture2017

    • 著者名/発表者名
      Takumi Honda, Yasuaki Ito, Koji Nakano
    • 雑誌名

      International Journal of Networking and Computing

      巻: 7 ページ: 69-85

    • DOI

      https://doi.org/10.15803/ijnc.7.1_69

    • 査読あり
  • [雑誌論文] An Efficient GPU Implementation of Bulk Computation of the Eigenvalue Problem for Many Small Real Non-symmetric Matrices2017

    • 著者名/発表者名
      Hiroki Tokura, Takumi Honda, Yasuaki Ito, Koji Nakano, Mitsuya Nishino, Yushiro Hirota, Masami Saeki
    • 雑誌名

      International Journal of Networking and Computing

      巻: 7 ページ: 227-247

    • DOI

      https://doi.org/10.15803/ijnc.7.2_227

    • 査読あり / オープンアクセス
  • [学会発表] Single Kernel Soft Synchronization Technique for Task Arrays on CUDA-enabled GPUs, with Applications2017

    • 著者名/発表者名
      Shunji Funasaka, Koji Nakano, Yasuaki Ito
    • 学会等名
      International Symposium on Computing and Networking
    • 国際学会
  • [学会発表] A Square Pointillism Image Generation, and Its GPU Acceleration2017

    • 著者名/発表者名
      Hiroki Tokura, Yuki Kuroda, Yasuaki Ito, Koji Nakano
    • 学会等名
      International Symposium on Computing and Networking
    • 国際学会
  • [学会発表] Simple and Fast Parallel Algorithms for the Voronoi Map and the Euclidean Distance Map, with GPU Implementations2017

    • 著者名/発表者名
      Takumi Honda, Shinnosuke Yamamoto, Hiroaki Honda, Koji Nakano, Yasuaki Ito
    • 学会等名
      International Conference on Parallel Processing
    • 国際学会
  • [学会発表] Accelerating the Smith-Waterman Algorithm Using Bitwise Parallel Bulk Computation Technique on GPU2017

    • 著者名/発表者名
      Takahiro Nishimura, Jacir Luiz Bordim, Yasuaki Ito, Koji Nakano
    • 学会等名
      International Parallel and Distributed Processing Symposium Workshops
    • 国際学会
  • [学会発表] Photomosaic Generation by Rearranging Subimages, with GPU Acceleration2017

    • 著者名/発表者名
      Yi Yang, Yasuaki Ito, Koji Nakano
    • 学会等名
      International Parallel and Distributed Processing Symposium Workshops
    • 国際学会
  • [学会発表] Almost Optimal Column-wise Prefix-sum Computation on the GPU2017

    • 著者名/発表者名
      Hiroki Tokura, Toru Fujita, Koji Nakano, Yasuaki Ito
    • 学会等名
      International Conference on Parallel Processing and Applied Mathematics
    • 国際学会
  • [学会発表] A GPU Implementation of Bulk Execution of the Dynamic Programming for the Optimal Polygon Triangulation2017

    • 著者名/発表者名
      Kohei Yamashita, Yasuaki Ito, Koji Nakano
    • 学会等名
      International Conference on Parallel Processing and Applied Mathematics
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi