• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Revolution of Programmability in Non-von Neumann Platforms by Employing Tandem CGRA + Stochastic Computing

Research Project

Project/Area Number 22H00515
Research InstitutionNara Institute of Science and Technology

Principal Investigator

中島 康彦  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (00314170)

Co-Investigator(Kenkyū-buntansha) ZHANG Renyuan  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (00709131)
木村 睦  奈良先端科学技術大学院大学, 先端科学技術研究科, 客員教授 (60368032)
Project Period (FY) 2022-04-01 – 2026-03-31
KeywordsCGRA / マルチレベルパイプライン / 確率的デジタル演算 / スパイクコーディング / 確率的多入力積和演算 / 可変容量素子
Outline of Annual Research Achievements

【1】物理演算器数を超える長大命令列を仮想化により非分割連続実行するタンデムCGRA:本年度は、大規模FPGAボード(VPK180)を用いた、マクロパイプライニングの実装を推進した。まず、400G-QSFPDDケーブルにより、VPK180を4枚相互接続したシステムを構成し、安定稼働するに至った。さらに、1組のDDR4メモリ空間に対し、64ユニット構成のIMAX2が8基接続するマルチレーン構成の開発を完了し、CIFAR10等の画像認識プログラムが、マイクロパイプライニングとマクロパイプライニングを併用して、安定稼働するに至った。
【2】メモリ空間を拡張する確率的デジタル演算機構:従来型確率的積和演算機構では、累算処理に、時間軸方向のスパイク蓄積演算が不可欠であった。本研究の確率的多入力デジタル積和演算機構では、Flash Computing技術(全スパイク信号の同時かつ瞬間的な観測により、一度に累算結果を推定する方法)を用いて、高速化を図った。本年度は、確率的表現 Multi-Radix-Coding(MRC)を使用し、DiaNet3.1と組み合わせることで、本方式の実現を目指した。7nm CMOSのHspiceシミュレーションでは、乗算、有限状態マシンベースのSC近似、多項式展開にて、各々、29,58,83TOPS/Wを達成した。
【3】確率的表現と可変容量素子による確率的多入力積和演算機構:スパイクベース演算は、センサー出力を従来型デジタル演算器に渡すインタフェースとしての位置付けが適すると判断し、イベントカメラを購入した。現在、スパイクベース演算機構を用いて、Human Action Recognition(HAR)を実装中である。また、CMOSプロセスと容量素子(CTM)を用いた試作LSIが納品され、評価ボードに搭載し、基本多入力積和演算の正常動作を確認した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の全体計画毎に列挙する。
【1】物理演算器数を超える長大命令列を仮想化により非分割連続実行するタンデムCGRA:CPUベースCGRA(IMAX2)の各ユニットとCPUをタンデム接続する低遅延仮想CGRAの実現に取り組む。本年度の目標は,3.カーネルの外側をRISCVが担当することによる,CGRAの容量を超えるプログラムに対するシームレスなCGRA制御。マクロパイプライニングが該当する3の完了を目指した結果、マクロパイプライニングを搭載したFPGAシステム、および、基本プログラミングフレームワークが完成した。さらに、当初は到達が難しいと考えていた、大規模言語モデルの実装に進んでいる。
【2】メモリ空間を拡張する確率的デジタル演算機構:疎行列圧縮表現と,確率的表現と,確率的計算を組み合わせ、多層畳み込みニューラルネットワーク,および,従来型アクセラレータでは対応できないアルゴリズムに対する確率的計算の適用可能性探索・必要精度探索・高速実装に取り組む。本年度の目標は、2.木構造型確率的積和演算手法。本年度の目標(2)を予定通り完了した。
【3】確率的表現と可変容量素子による確率的多入力積和演算機構:省電力近似計算のキーデバイスである強誘電体薄膜に着目する。デバイス試作・特性評価とアナログ回路シミュレーションを組み合わせて、多入力積和演算器に留まらない,グラフ探索問題等の様々なアプリケーションに応用可能なハードウェア構成方法と安定化手法の確立に取り組む。本年度の目標は、2.Hspiceに依存しないデバイスシミュレータであったものの、スパイクベース計算のポテンシャルが高いことがわかってきたため、デバイスモデルのシミュレーション環境ではなく、高次のスパイクベースシミュレーションに移行し、トランスフォーマ等の複雑かつ実用的アプリケーションの実装に向かうこととした。

Strategy for Future Research Activity

【1】初年度に、単一リング構造内でのタンデム実行(ミディアムパイプライン処理)が可能となった。2年度には、研究費繰越により、新たな大規模FPGAボード(VPK180)を購入し、最大8個の複数リングを接続して、異なるカーネルを同時に写像する仮想化方式(マクロパイプライニング処理)の開発を完了した。本年度は、これらを用いて、大規模言語モデル(LLM)が多用するトランスフォーマ、および、メモリ使用量を削減可能な、Flash Attentionの実装を推進する。
【2】初年度および2年度に、確率的積和演算機構の高速化を行った。本年度は、LLM等の大規模アプリケーションへの応用に挑戦する。
【3】容量素子とスパイク表現を組み合わせた、確率的多入力積和演算機構のプロトタイプLSIが完成している。本年度は、LSIの評価を行う。また、大規模アプリケーションへの応用を目指す、スパイキング・トランスフォーマの実装および評価を推進する。

  • Research Products

    (22 results)

All 2024 2023 Other

All Journal Article (16 results) (of which Peer Reviewed: 16 results) Presentation (4 results) (of which Int'l Joint Research: 4 results,  Invited: 1 results) Remarks (2 results)

  • [Journal Article] Flexible and Energy-Efficient Crypto-Processor for Arbitrary Input Length Processing in Blockchain-Based IoT Applications2024

    • Author(s)
      LE Vu-Trung-Duong、PHAM Hoai-Luan、TRAN Thi-Hong、NAKASHIMA Yasuhiko
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E107.A Pages: 319~330

    • DOI

      10.1587/transfun.2023CIP0013

    • Peer Reviewed
  • [Journal Article] A Compressed Spiking Neural Network Onto a Memcapacitive In-Memory Computing Array2024

    • Author(s)
      Oshio Reon、Sugahara Takuya、Sawada Atsushi、Kimura Mutsumi、Zhang Renyuan、Nakashima Yasuhiko
    • Journal Title

      IEEE Micro

      Volume: 44 Pages: 8~16

    • DOI

      10.1109/MM.2023.3285529

    • Peer Reviewed
  • [Journal Article] Small-Footprint Reconfigurable Heterogeneous Cryptographic Accelerator for Fog Computing2023

    • Author(s)
      Thi Sang Duong、Pham Hoai Luan、Duong Le Vu Trung、Imamura Ren、Tran Thi Hong、Nakashima Yasuhiko
    • Journal Title

      RIVF'23

      Volume: 1 Pages: 23-25

    • DOI

      10.1109/RIVF60135.2023.10471770

    • Peer Reviewed
  • [Journal Article] Universal 32/64-bit CGRA for Lightweight Cryptography in Securing IoT Data Transmission2023

    • Author(s)
      Thi Sang Duong、Luan Pham Hoai、Duong Le Vu Trung、Tran Thi Diem、Imamura Ren、Nam Nguyen Quoc Duy、Tran Thi Hong、Nakashima Yasuhiko
    • Journal Title

      IEEE International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC 2023)

      Volume: 1 Pages: 419-425

    • DOI

      10.1109/MCSoC60832.2023.00069

    • Peer Reviewed
  • [Journal Article] High-efficiency Reconfigurable Crypto Accelerator Utilizing Innovative Resource Sharing and Parallel Processing2023

    • Author(s)
      Duong Le Vu Trung、Pham Hoai Luan、Tran Thi Hong、Duong Thi Sang、Nakashima Yasuhiko
    • Journal Title

      IEEE International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC 2023)

      Volume: 1 Pages: 576-583

    • DOI

      10.1109/MCSoC60832.2023.00090

    • Peer Reviewed
  • [Journal Article] Efficient and High-Speed CGRA Accelerator for Cryptographic Applications2023

    • Author(s)
      Le Vu Trung Duong、Pham Hoai Luan、Tran Thi Hong、Duong Thi Sang、Nakashima Yasuhiko
    • Journal Title

      CANDAR'23

      Volume: 1 Pages: 189-195

    • DOI

      10.1109/CANDAR60563.2023.00033

    • Peer Reviewed
  • [Journal Article] RHCP: A Reconfigurable High-efficient Cryptographic Processor for Decentralized IoT Platforms2023

    • Author(s)
      Duong Le Vu Trung、Pham Hoai Luan、Duong Thi Sang、Tran Thi Hong、Nam Nguyen Quoc Duy、Nakashima Yasuhiko
    • Journal Title

      IEEE International Conference on Knowledge and Systems Engineering (KSE2023)

      Volume: 1 Pages: 1-6

    • DOI

      10.1109/KSE59128.2023.10299457

    • Peer Reviewed
  • [Journal Article] Versatile Resource-shared Cryptographic Accelerator for Multi-Domain Applications2023

    • Author(s)
      Le Vu Trung Duong、Pham Hoai Luan、Tran Thi Hong、Nguyen Quoc Duy Nam、Thi Sang Duong、Nakashima Yasuhiko
    • Journal Title

      IEEE ICICDT2023

      Volume: 1 Pages: 1-6

    • DOI

      10.1109/ICICDT59917.2023.10332303

    • Peer Reviewed
  • [Journal Article] Power-Efficient and Programmable Hashing Accelerator for Massive Message Processing2023

    • Author(s)
      Duong Thi Sang、Pham Hoai Luan、Duong Le Vu Trung、Tran Thi Hong、Nakashima Yasuhiko
    • Journal Title

      SOCC2023

      Volume: 1 Pages: 1-6

    • DOI

      10.1109/SOCC58585.2023.10256890

    • Peer Reviewed
  • [Journal Article] Energy-Efficient Unified Multi-Hash Coprocessor for Securing IoT Systems Integrating Blockchain2023

    • Author(s)
      Luan Pham Hoai、Duong Thi Sang、Duong Le Vu Trung、Tran Thi Hong、Nakashima Yasuhiko
    • Journal Title

      MWCAS2023

      Volume: 1 Pages: 1-6

    • DOI

      10.1109/MWSCAS57524.2023.10405932

    • Peer Reviewed
  • [Journal Article] Sensitivity Analysis of Memory Bandwidth on Column-superposed Versatile Linear CGRA2023

    • Author(s)
      Akabe Tomoya、Funai Ryotaro、Nakashima Yasuhiko
    • Journal Title

      IEEE Interregional NEWCAS Conferenc

      Volume: 1 Pages: 26-28

    • DOI

      10.1109/NEWCAS57931.2023.10198161

    • Peer Reviewed
  • [Journal Article] Implementation of Fully-Pipelined CNN Inference Accelerator on FPGA and HBM2 Platform2023

    • Author(s)
      NGUYEN Van-Cam、NAKASHIMA Yasuhiko
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E106.D Pages: 1117~1129

    • DOI

      10.1587/transinf.2022EDP7155

    • Peer Reviewed
  • [Journal Article] Flexible and Scalable BLAKE/BLAKE2 Coprocessor for Blockchain-Based IoT Applications2023

    • Author(s)
      Pham Hoai Luan、Tran Thi Hong、Duong Le Vu Trung、Yasuhiko Nakashima
    • Journal Title

      IEEE Design & Test

      Volume: 40 Pages: 15~25

    • DOI

      10.1109/MDAT.2023.3276936

    • Peer Reviewed
  • [Journal Article] Neuromorphic System Using Crosspoint-Type TaO<i> <sub>x</sub> </i>/Ta Memristors and Direct Device Training for Associative Memory2023

    • Author(s)
      Kimura Mutsumi、Tanaka Ryo、Akane Shihori、Horiuchi Isao、Hiroshima Yasushi、Nakashima Yasuhiko
    • Journal Title

      IEEE Transactions on Electron Devices

      Volume: 70 Pages: 4635~4640

    • DOI

      10.1109/TED.2023.3296393

    • Peer Reviewed
  • [Journal Article] Time-domain Subtractive Readout Scheme for Scalable Capacitive Analog In-Memory Computing2023

    • Author(s)
      Oshio Reon、Kuwahara Takumi、Kimura Mutsumi、Nakashima Yasuhiko
    • Journal Title

      IEEE International System-On-Chip Conference (SOCC2023)

      Volume: 1 Pages: 1-6

    • DOI

      10.1109/SOCC58585.2023.10256918

    • Peer Reviewed
  • [Journal Article] Spiking Neuromorphic System using Memcapacitors and Pulse Accumulation Circuits2023

    • Author(s)
      Atsushi Sawada, Reon Ochio, Mutsumi Kimura, Rnyuan Zhang, Y.Nakashima
    • Journal Title

      IEICE NOLTA, pp.124-127

      Volume: ISSN:2188-5079 Pages: 124-127

    • DOI

      10.34385/proc.76.A3L-33

    • Peer Reviewed
  • [Presentation] IMAX3: Multi-level Pipelined CGRA for Power-efficient +AI Computing2023

    • Author(s)
      Y. Nakashima
    • Organizer
      Tutorial: Carbon Neutral Computing for Engineerable AI, AICAS2023
    • Int'l Joint Research / Invited
  • [Presentation] Trainig Efficient Stochastic Computing Neural Networks Using One-bit Unipolar Encoding2023

    • Author(s)
      B.Golbabaei, Y.Kan, R.Zhang, and Y.Nakashima
    • Organizer
      The 11th RIEC International Symposium on Brain Functions and Brain Computer
    • Int'l Joint Research
  • [Presentation] A Stochastic Encoding Approach for Robust Brain-Inspired Hyperdimensional Computing2023

    • Author(s)
      H.Tang, Y.Kan, R.Zhang, and Y.Nakashim
    • Organizer
      The 11th RIEC International Symposium on Brain Functions and Brain Computer
    • Int'l Joint Research
  • [Presentation] Memcapacitor-type Synapse and AC Driving Scheme for Ultra-low Power Consumption Neuromorphic Systems2023

    • Author(s)
      T. Kuwahara, H. Umemura, M. Kimura, Y. Ishisaki, H. Nishinaka, Y. Nakashima
    • Organizer
      ICONS2023 (poster)
    • Int'l Joint Research
  • [Remarks] Computing Architecture Lab.

    • URL

      http://archlab.naist.jp/

  • [Remarks] Sustainable Computing Architecture Lab.

    • URL

      https://www.youtube.com/@computingarchitecturelab.5300/playlists

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi