• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

高性能アクセラレーション基盤技術の研究

Research Project

Project/Area Number 24240005
Research InstitutionNara Institute of Science and Technology

Principal Investigator

中島 康彦  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00314170)

Co-Investigator(Kenkyū-buntansha) 姚 駿  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (40567153)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywords演算器アレイ / アクセラレータ / ステンシル計算 / ベクトル計算 / 低電力 / グラフ処理
Outline of Annual Research Achievements

【1】限りあるデータ供給能力と演算器の関連付け(主にハードウェア構成)は、電力効率や性能見通しに難点があるマルチスレッディング機構を投入することなくデータ供給性能を目一杯使う、低電力(電力効率10倍)かつ性能見通しの良い(チューニングコスト半
減)アクセラレーション技術の創出を目指すものである。H26年度は、従来型演算器アレイ型アクセラレータの弱点であるデータ伝搬オーバヘッドを削減し、さらに、ベクトル演算機構としても利用可能な新しい多数演算器制御方式の12.5mm□LSIを開発し、評価ボード上で正常動作を確認した。消費電力はわずかに0.88Watt、電力あたり性能は7.7GFlops/Wattに達した。
【2】アプリケーションとアクセラレータの関連付け(主にバイナリトランスレータ)は、迅速な導入を可能とするために、新命令セットとコンパイラを開発するのではなく、汎用CPUの命令列からアクセラレータ用命令列を生成するバイナリトランスレーション技術
の創出に取り組むものである。H26年度は、バイナリトランスレータの開発を完了し、さらに、ステンシル計算に最適化したパラメタライズドライブラリの開発を行った。現在、アプリケーションプログラムが、LSI上で動作している。
【3】ハードウェア機構とアクセラレータ用命令列の動的適合(主に動的チューニング機構)は、幅優先実行するベクトル演算方式、深さ優先実行する演算器アレイ方式、あるいは、複合方式やその他の方式の組み合わせにより実行するチューニング技術に取り込むも
のである。H26年度は、前述したライブラリの1機能として実装した。また、グラフ処理への適用手法に関して研究を進め、トランザクショナルユニットの追加による高性能化の可能性を示した。

Research Progress Status

26年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

26年度が最終年度であるため、記入しない。

  • Research Products

    (22 results)

All 2015 2014 Other

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results,  Acknowledgement Compliant: 3 results) Presentation (15 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] A Flexible, Self-Tuning, Fault-Tolerant Functional Unit Array Processor2014

    • Author(s)
      Jun Yao, Yasuhiko Nakashima, Mitsutoshi Saito, Yohei Hazama, Ryosuke Yamanaka
    • Journal Title

      IEEE Micro

      Volume: 34-6 Pages: 54 - 63

    • DOI

      10.1109/MM.2014.92

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] A Tightly Coupled General Purpose Reconfigurable Accelerator LAPP and Its Power States for HotSpot-Based Energy Reduction2014

    • Author(s)
      Jun YAO, Yasuhiko NAKASHIMA, Naveen DEVISETTI, Kazuhiro YOSHIMURA, Takashi NAKADA
    • Journal Title

      IEICE Trans.

      Volume: E97-D-12 Pages: 3092-3100

    • DOI

      10.1587/transinf.2014PAP0025

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Hinting for Auto-Memoization Processor based on Static Binary Analysis2014

    • Author(s)
      Takanori TSUMURA, Yuuki SHIBATA, Kazutaka KAMIMURA, Tomoaki TSUMURA, Yasuhiko NAKASHIMA
    • Journal Title

      Proc. 2nd Int'l Workshop on Computer Systems and Architectures

      Volume: CSA'14 Pages: 426-432

    • DOI

      10.1109/CANDAR.2014.49

    • Peer Reviewed / Open Access
  • [Journal Article] Performance Evaluation of a 3D-Stencil Library for Distributed Memory Array Accelerators2014

    • Author(s)
      Yoshikazu Inagaki, Shinya Takamaeda-Yamazaki, Jun Yao, Yasuhiko Nakashima
    • Journal Title

      Proc. 2nd Int'l Workshop on Computer Systems and Architectures

      Volume: CSA'14 Pages: 388-393

    • DOI

      10.1109/CANDAR.2014.100

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] An Implementation of Auto-Memoization Mechanism on ARM-based Superscalar Processor2014

    • Author(s)
      Yuuki Shibata, Takanori Tsumura, Tomoaki Tsumura and Yasuhiko Nakashima
    • Journal Title

      Proc. Int'l Symp. on System-on-Chip 2014

      Volume: SoC2014 Pages: 1-8

    • DOI

      10.1109/ISSOC.2014.6972435

    • Peer Reviewed / Open Access
  • [Presentation] A Parameterized Many Core Simulator for Design Space Exploration2015

    • Author(s)
      Shohei Takeuchi, Thi Hong Tran, Shinya Takamaeda, Yasuhiko Nakashima
    • Organizer
      IEEE Symposium on Low-Power and High-Speed Chips
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2015-04-13 – 2015-04-15
  • [Presentation] XStenciler: a 7.1GFLOPS/W 16-Core Coprocessor with a Ring Structure for Stencil Applications2015

    • Author(s)
      Jun Yao, Yasuhiko Nakashima, Kazutoshi Kobayashi, Makoto Ikeda, Wei Xue, Tomohiro Fujiwara, Ryo Shimizu, Masakazu Tanomoto, Yangtong Xu, Xinliang Wang, Weimin Zheng
    • Organizer
      XStenciler: a 7.1GFLOPS/W 16-Core Coprocessor with a Ring Structure for Stencil Applications
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2015-04-13 – 2015-04-15
  • [Presentation] Lowering the Complexity of k-means Clustering by BFS-dijkstra method for Graph Computing2015

    • Author(s)
      Anna Zhang, Jun Yao, Yasuhiko Nakashima
    • Organizer
      XStenciler: a 7.1GFLOPS/W 16-Core Coprocessor with a Ring Structure for Stencil Applications
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2015-04-13 – 2015-04-15
  • [Presentation] 次世代アプリケーションのための包括的なアーキテクチャ探索環境の検討2014

    • Author(s)
      竹内昌平, 高前田(山崎)伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-89
    • Place of Presentation
      機械振興会館
    • Year and Date
      2014-12-01 – 2014-12-02
  • [Presentation] データムービングボトルネックを解決するためのインテリジェントメモリシステムの検討2014

    • Author(s)
      枝元正寛, 高前田伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-91
    • Place of Presentation
      機械振興会館
    • Year and Date
      2014-12-01 – 2014-12-02
  • [Presentation] Triangle Countingのための大規模グラフ分割手法2014

    • Author(s)
      平野竜洋, 高前田伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-73
    • Place of Presentation
      ビーコンプラザ(別府国際コンベンションセンター)
    • Year and Date
      2014-11-26 – 2014-11-28
  • [Presentation] 最短経路探索の並列化と各種プラットホームによる性能比較2014

    • Author(s)
      紅林修斗, 高前田伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-74
    • Place of Presentation
      ビーコンプラザ(別府国際コンベンションセンター)
    • Year and Date
      2014-11-26 – 2014-11-28
  • [Presentation] メモリネットワークベースアクセラレータの試作と評価2014

    • Author(s)
      清水怜, 田ノ元正和, 高前田(山崎)伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-81
    • Place of Presentation
      ビーコンプラザ(別府国際コンベンションセンター)
    • Year and Date
      2014-11-26 – 2014-11-28
  • [Presentation] メモリネットワークベースアクセラレータを用いた畳み込みニューラルネットワーク処理2014

    • Author(s)
      田ノ元正和, 高前田(山崎)伸也, 姚駿, 中島康彦
    • Organizer
      信学技報CPSY2014-82
    • Place of Presentation
      ビーコンプラザ(別府国際コンベンションセンター)
    • Year and Date
      2014-11-26 – 2014-11-28
  • [Presentation] ニューラルネットワーク処理のエラー削減に向けた命令実行手法2014

    • Author(s)
      小池和正,高前田(山崎)伸也,姚駿,中島康彦
    • Organizer
      信学技報CPSY2014-33
    • Place of Presentation
      朱鷺メッセ 新潟コンベンションセンター
    • Year and Date
      2014-07-29 – 2014-07-30
  • [Presentation] PyCoRAMを用いたグラフ処理FPGAアクセラレータ2014

    • Author(s)
      高前田(山崎)伸也,枝元正寛,姚駿,中島康彦
    • Organizer
      信学技報CPSY2014-10
    • Place of Presentation
      朱鷺メッセ 新潟コンベンションセンター
    • Year and Date
      2014-07-28 – 2014-07-30
  • [Presentation] メモリインテンシブアレイアクセラレータを用いた高性能グラフ処理2014

    • Author(s)
      清水怜,高前田(山崎)伸也,姚駿,中島康彦
    • Organizer
      信学技報CPSY2014-11
    • Place of Presentation
      朱鷺メッセ 新潟コンベンションセンター
    • Year and Date
      2014-07-28 – 2014-07-30
  • [Presentation] Performance Tuning of a Global Shallow-water Atmospheric Model on Xeon Phi2014

    • Author(s)
      Masakazu Tanomoto, Jun Yao, Yasuhiko Nakashima, Yangtong Xu, Xinliang Wang, Wei Xue
    • Organizer
      IEEE Symposium on Low-Power and High-Speed Chips
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2014-04-14 – 2014-04-16
  • [Presentation] A Pipelined Newton-Raphson Method for Floating Point Division and Square Root on Distribted Memory CGRAs2014

    • Author(s)
      Shuto Kurebayashi, Jun Yao, Yasuhiko Nakashima
    • Organizer
      IEEE Symposium on Low-Power and High-Speed Chips
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2014-04-14 – 2014-04-16
  • [Presentation] Tuning of a Breadth First based Triangle-counting by using Multi-threading2014

    • Author(s)
      Tatsuhiro Hirano, Jun Yao, Yasuhiko Nakashima
    • Organizer
      IEEE Symposium on Low-Power and High-Speed Chips
    • Place of Presentation
      Yokohama Bunka-Center(Yokohama)
    • Year and Date
      2014-04-14 – 2014-04-14
  • [Remarks] コンピューティング・アーキテクチャ研究室

    • URL

      http://arch.naist.jp/

  • [Patent(Industrial Property Rights)] データ処理装置2015

    • Inventor(s)
      中島康彦・高前田伸也
    • Industrial Property Rights Holder
      中島康彦・高前田伸也
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      特願2015-079552
    • Filing Date
      2015-04-08

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi