エッジAIシステム向け設計基盤技術に関する研究

Research Project

Project/Area Number	22K11956
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 60040:Computer system-related
Research Institution	Kumamoto University
Principal Investigator	尼崎太樹熊本大学, 大学院先端科学研究部(工), 教授 (50467974)
Co-Investigator(Kenkyū-buntansha)	木山真人熊本大学, 大学院先端科学研究部(工), 助教 (30363534)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000) Fiscal Year 2022: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Keywords	DNNコンパイラ / NVAR Mixer / エッジAI / 深層学習週 / ニューラルネットワーク / 集積回路 / コンパイラ / 深層学習
Outline of Research at the Start	IoTの普及により，現場にあるエッジ端末が無線通信でデータを収集し，クラウドに自動でアップできる環境が整ってきた．こうした中，通信量，機密性，実時間応答性の観点より，エッジ側で知的な処理を行うエッジAIコンピューティングが注目されている．一方，電力，メモリ，速度などあらゆる計算リソースに制約がかかる汎用プロセッサでは，深層学習技術を十分に活用することが難しい．本研究では，高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できる，エッジAI向け設計基盤技術の確立を目的とする．
Outline of Annual Research Achievements	高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できるエッジAI端末，および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とした．2023年度はエッジAI向けのDNNモデル開発およびDNNコンパイラ開発を行った．DNNモデルにおいては，従来のCNN（Convolutional Neural Network）とは異なる形で，リザバーコンピューティングモデルの数学的等価モデルであるNVAR（非線形ベクトル自己回帰）をベースとした混合型モデルを提案し，その評価を行った（このモデルをNVAR-Mixerとよぶ）．本モデルではオーバーラップパッチ埋め込みを適用し，Mixer型NVARの内部で垂直方向と水平方向の操作を行うためにシーケンサーアーキテクチャを適用した．提案モデルの性能を向上させるために，ウィンドウ分割技術と一般的な2次位置エンコーディングを採用した．提案モデルは，0.159MパラメータのCIFAR-10データセットに対して分類精度82.48%，0.106MパラメータのMNISTに対して分類精度98.36%のトップ1精度を達成した．さらに，CPUでのスループットを評価したところ，CIFAR-10データセットでは190.1画像/秒，MNISTデータセットでは106.7画像/秒であった．これらの認識精度は，最新の畳み込みニューラルネットワークベースのモデルであるMLP-Mixerや，ハイパーパラメータを同じチューニングにした従来のリザーバーコンピューティングベースのMixerモデルと競合するものである．また，DNNコンパイラにおいてはPytorchで開発したAIモデルをXilinx Vitis（高位合成ツール）に直接合成可能なC++を生成するトランスレータを開発し，その動作を確認した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究では，高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できるエッジAI端末，および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とする．初年度にPosit化の基礎検討を行い，そこで従来には無い新たなDNNモデルの必要性が生じ，それに向けてNVAR-Mixerを提案し，その効果を示すことができた．実際にこれらの評価結果をIEEE Accessに投稿し，2023年10月にアクセプトされた．DNNコンパイラにおいても現在，PytorchからVitisまでシームレスに合成可能なトランスレータのプロトタイプ設計および評価が完了し，現在は論文誌へ投稿している状況である．
Strategy for Future Research Activity	申請書の経緯に沿って，概ね研究が進んでいる．2024年度は最終年度のため，NVAR-Mixerの応用および，本アーキテクチャをベースとしたオブジェクトディテクションモデルへの発展を検討していく．廉価版のFPGA（Field Programmable Gate Array）を対象に，NVAR-Mixerの実装評価を行い，物理性能を評価する予定である．同様にDNNコンパイラに関しては，可能であればMLIRを用いた論理最適化を行い，現状のトランスレータ版と比較して，最終的な回路性能が向上することを確認する．上記2つを明らかにすることで，エッジ再度のAI設計手法（超軽量なDNNアーキテクチャ，および回路設計技術）の基礎を明らかにすることを目的とする．

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(6 results)

All 2023 2022 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results, Open Access: 2 results) Presentation (1 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

[Journal Article] A Lightweight Deep Neural Network Using a Mixer-Type Nonlinear Vector Autoregression2023
- Author(s)
  Diana Mery、Amin Ridhwan、Amagasaki Motoki、Kiyama Masato
- Journal Title
  
  IEEE Access
  
  Volume: 11 Pages: 103544-103553
- DOI
  10.1109/access.2023.3318873
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] `A Deep Neural Network Translator for Edge Site Implementation2023
- Author(s)
  Mery Diana, Masato Kiyama, Motoki Amagasaki, Masayoshi Ito and Yuki Morishita
- Journal Title
  
  Proc. of CANDARW
  
  Volume: CSA93
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] A Posit Based Multiply-accumulate Unit with Small Quire Size for Deep Neural Networks2022
- Author(s)
  Yasuhiro Nakahara, Yuta Masuda, Masato Kiyama, Motoki Amagasaki and Masahiro Iida
- Journal Title
  
  IPSJ Transactions on System LSI Design Methodology
  
  Volume: 15 Issue: 0 Pages: 16-19
- DOI
  10.2197/ipsjtsldm.15.16
- ISSN
  1882-6687
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Presentation] Posit-Based Vision Transformer(ViT) Exploration at Edge Sites2022
- Author(s)
  Mery Diana
- Organizer
  IEEE Symposium on Low-Power and High-Speed Chips and Systems(COOL Chips 25)
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Remarks] 知能システム研究室HP
- URL
  http://www.isys.cs.kumamoto-u.ac.jp/publication.html
- Related Report
  2023 Research-status Report
[Remarks] 熊本大学工学部情報電気工学科知能システム研究室HP
- URL
  http://www.isys.cs.kumamoto-u.ac.jp/
- Related Report
  2022 Research-status Report

エッジAIシステム向け設計基盤技術に関する研究

Principal Investigator

尼崎 太樹 熊本大学, 大学院先端科学研究部(工), 教授 (50467974)

¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] A Lightweight Deep Neural Network Using a Mixer-Type Nonlinear Vector Autoregression2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] `A Deep Neural Network Translator for Edge Site Implementation2023

Author(s)

Journal Title

Related Report

[Journal Article] A Posit Based Multiply-accumulate Unit with Small Quire Size for Deep Neural Networks2022

Author(s)

Journal Title

DOI

ISSN

Related Report

[Presentation] Posit-Based Vision Transformer(ViT) Exploration at Edge Sites2022

Author(s)

Organizer

Related Report

[Remarks] 知能システム研究室HP

URL

Related Report

[Remarks] 熊本大学工学部情報電気工学科知能システム研究室HP

URL

Related Report

尼崎太樹熊本大学, 大学院先端科学研究部(工), 教授 (50467974)