• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

エッジAIシステム向け設計基盤技術に関する研究

Research Project

Project/Area Number 22K11956
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60040:Computer system-related
Research InstitutionKumamoto University

Principal Investigator

尼崎 太樹  熊本大学, 大学院先端科学研究部(工), 教授 (50467974)

Co-Investigator(Kenkyū-buntansha) 木山 真人  熊本大学, 大学院先端科学研究部(工), 助教 (30363534)
Project Period (FY) 2022-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
KeywordsDNNコンパイラ / NVAR Mixer / エッジAI / 深層学習週 / ニューラルネットワーク / 集積回路 / コンパイラ / 深層学習
Outline of Research at the Start

IoTの普及により,現場にあるエッジ端末が無線通信でデータを収集し,クラウドに自動でアップできる環境が整ってきた.こうした中,通信量,機密性,実時間応答性の観点より,エッジ側で知的な処理を行うエッジAIコンピューティングが注目されている.一方,電力,メモリ,速度などあらゆる計算リソースに制約がかかる汎用プロセッサでは,深層学習技術を十分に活用することが難しい.本研究では,高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できる,エッジAI向け設計基盤技術の確立を目的とする.

Outline of Annual Research Achievements

高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できるエッジAI端末,および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とした.2023年度はエッジAI向けのDNNモデル開発およびDNNコンパイラ開発を行った.DNNモデルにおいては,従来のCNN(Convolutional Neural Network)とは異なる形で,リザバーコンピューティングモデルの数学的等価モデルであるNVAR(非線形ベクトル自己回帰)をベースとした混合型モデルを提案し,その評価を行った(このモデルをNVAR-Mixerとよぶ).本モデルではオーバーラップパッチ埋め込みを適用し,Mixer型NVARの内部で垂直方向と水平方向の操作を行うためにシーケンサーアーキテクチャを適用した.提案モデルの性能を向上させるために,ウィンドウ分割技術と一般的な2次位置エンコーディングを採用した.提案モデルは,0.159MパラメータのCIFAR-10データセットに対して分類精度82.48%,0.106MパラメータのMNISTに対して分類精度98.36%のトップ1精度を達成した.さらに,CPUでのスループットを評価したところ,CIFAR-10データセットでは190.1画像/秒,MNISTデータセットでは106.7画像/秒であった.これらの認識精度は,最新の畳み込みニューラルネットワークベースのモデルであるMLP-Mixerや,ハイパーパラメータを同じチューニングにした従来のリザーバーコンピューティングベースのMixerモデルと競合するものである.また,DNNコンパイラにおいてはPytorchで開発したAIモデルをXilinx Vitis(高位合成ツール)に直接合成可能なC++を生成するトランスレータを開発し,その動作を確認した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では,高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できるエッジAI端末,および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とする.
初年度にPosit化の基礎検討を行い,そこで従来には無い新たなDNNモデルの必要性が生じ,それに向けてNVAR-Mixerを提案し,その効果を示すことができた.実際にこれらの評価結果をIEEE Accessに投稿し,2023年10月にアクセプトされた.DNNコンパイラにおいても現在,PytorchからVitisまでシームレスに合成可能なトランスレータのプロトタイプ設計および評価が完了し,現在は論文誌へ投稿している状況である.

Strategy for Future Research Activity

申請書の経緯に沿って,概ね研究が進んでいる.2024年度は最終年度のため,NVAR-Mixerの応用および,本アーキテクチャをベースとしたオブジェクトディテクションモデルへの発展を検討していく.廉価版のFPGA(Field Programmable Gate Array)を対象に,NVAR-Mixerの実装評価を行い,物理性能を評価する予定である.同様にDNNコンパイラに関しては,可能であればMLIRを用いた論理最適化を行い,現状のトランスレータ版と比較して,最終的な回路性能が向上することを確認する.上記2つを明らかにすることで,エッジ再度のAI設計手法(超軽量なDNNアーキテクチャ,および回路設計技術)の基礎を明らかにすることを目的とする.

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (6 results)

All 2023 2022 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results) Presentation (1 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

  • [Journal Article] A Lightweight Deep Neural Network Using a Mixer-Type Nonlinear Vector Autoregression2023

    • Author(s)
      Diana Mery、Amin Ridhwan、Amagasaki Motoki、Kiyama Masato
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 103544-103553

    • DOI

      10.1109/access.2023.3318873

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] `A Deep Neural Network Translator for Edge Site Implementation2023

    • Author(s)
      Mery Diana, Masato Kiyama, Motoki Amagasaki, Masayoshi Ito and Yuki Morishita
    • Journal Title

      Proc. of CANDARW

      Volume: CSA93

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] A Posit Based Multiply-accumulate Unit with Small Quire Size for Deep Neural Networks2022

    • Author(s)
      Yasuhiro Nakahara, Yuta Masuda, Masato Kiyama, Motoki Amagasaki and Masahiro Iida
    • Journal Title

      IPSJ Transactions on System LSI Design Methodology

      Volume: 15 Issue: 0 Pages: 16-19

    • DOI

      10.2197/ipsjtsldm.15.16

    • ISSN
      1882-6687
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Posit-Based Vision Transformer(ViT) Exploration at Edge Sites2022

    • Author(s)
      Mery Diana
    • Organizer
      IEEE Symposium on Low-Power and High-Speed Chips and Systems(COOL Chips 25)
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Remarks] 知能システム研究室HP

    • URL

      http://www.isys.cs.kumamoto-u.ac.jp/publication.html

    • Related Report
      2023 Research-status Report
  • [Remarks] 熊本大学工学部情報電気工学科知能システム研究室HP

    • URL

      http://www.isys.cs.kumamoto-u.ac.jp/

    • Related Report
      2022 Research-status Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi