エッジAIシステム向け設計基盤技術に関する研究

研究課題

研究課題/領域番号	22K11956
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60040:計算機システム関連
研究機関	熊本大学
研究代表者	尼崎太樹熊本大学, 大学院先端科学研究部(工), 教授 (50467974)
研究分担者	木山真人熊本大学, 大学院先端科学研究部(工), 助教 (30363534)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	DNNコンパイラ / NVAR Mixer / エッジAI / 深層学習週 / ニューラルネットワーク / 集積回路 / コンパイラ / 深層学習
研究開始時の研究の概要	IoTの普及により，現場にあるエッジ端末が無線通信でデータを収集し，クラウドに自動でアップできる環境が整ってきた．こうした中，通信量，機密性，実時間応答性の観点より，エッジ側で知的な処理を行うエッジAIコンピューティングが注目されている．一方，電力，メモリ，速度などあらゆる計算リソースに制約がかかる汎用プロセッサでは，深層学習技術を十分に活用することが難しい．本研究では，高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できる，エッジAI向け設計基盤技術の確立を目的とする．
研究実績の概要	高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できるエッジAI端末，および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とした．2023年度はエッジAI向けのDNNモデル開発およびDNNコンパイラ開発を行った．DNNモデルにおいては，従来のCNN（Convolutional Neural Network）とは異なる形で，リザバーコンピューティングモデルの数学的等価モデルであるNVAR（非線形ベクトル自己回帰）をベースとした混合型モデルを提案し，その評価を行った（このモデルをNVAR-Mixerとよぶ）．本モデルではオーバーラップパッチ埋め込みを適用し，Mixer型NVARの内部で垂直方向と水平方向の操作を行うためにシーケンサーアーキテクチャを適用した．提案モデルの性能を向上させるために，ウィンドウ分割技術と一般的な2次位置エンコーディングを採用した．提案モデルは，0.159MパラメータのCIFAR-10データセットに対して分類精度82.48%，0.106MパラメータのMNISTに対して分類精度98.36%のトップ1精度を達成した．さらに，CPUでのスループットを評価したところ，CIFAR-10データセットでは190.1画像/秒，MNISTデータセットでは106.7画像/秒であった．これらの認識精度は，最新の畳み込みニューラルネットワークベースのモデルであるMLP-Mixerや，ハイパーパラメータを同じチューニングにした従来のリザーバーコンピューティングベースのMixerモデルと競合するものである．また，DNNコンパイラにおいてはPytorchで開発したAIモデルをXilinx Vitis（高位合成ツール）に直接合成可能なC++を生成するトランスレータを開発し，その動作を確認した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究では，高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり，多様化するAIモデルに柔軟に対応できるエッジAI端末，および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とする．初年度にPosit化の基礎検討を行い，そこで従来には無い新たなDNNモデルの必要性が生じ，それに向けてNVAR-Mixerを提案し，その効果を示すことができた．実際にこれらの評価結果をIEEE Accessに投稿し，2023年10月にアクセプトされた．DNNコンパイラにおいても現在，PytorchからVitisまでシームレスに合成可能なトランスレータのプロトタイプ設計および評価が完了し，現在は論文誌へ投稿している状況である．
今後の研究の推進方策	申請書の経緯に沿って，概ね研究が進んでいる．2024年度は最終年度のため，NVAR-Mixerの応用および，本アーキテクチャをベースとしたオブジェクトディテクションモデルへの発展を検討していく．廉価版のFPGA（Field Programmable Gate Array）を対象に，NVAR-Mixerの実装評価を行い，物理性能を評価する予定である．同様にDNNコンパイラに関しては，可能であればMLIRを用いた論理最適化を行い，現状のトランスレータ版と比較して，最終的な回路性能が向上することを確認する．上記2つを明らかにすることで，エッジ再度のAI設計手法（超軽量なDNNアーキテクチャ，および回路設計技術）の基礎を明らかにすることを目的とする．

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(6件)

すべて 2023 2022 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 2件) 学会発表 (1件) (うち国際学会 1件) 備考 (2件)

[雑誌論文] A Lightweight Deep Neural Network Using a Mixer-Type Nonlinear Vector Autoregression2023
- 著者名/発表者名
  Diana Mery、Amin Ridhwan、Amagasaki Motoki、Kiyama Masato
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 103544-103553
- DOI
  10.1109/access.2023.3318873
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] `A Deep Neural Network Translator for Edge Site Implementation2023
- 著者名/発表者名
  Mery Diana, Masato Kiyama, Motoki Amagasaki, Masayoshi Ito and Yuki Morishita
- 雑誌名
  
  Proc. of CANDARW
  
  巻: CSA93
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] A Posit Based Multiply-accumulate Unit with Small Quire Size for Deep Neural Networks2022
- 著者名/発表者名
  Yasuhiro Nakahara, Yuta Masuda, Masato Kiyama, Motoki Amagasaki and Masahiro Iida
- 雑誌名
  
  IPSJ Transactions on System LSI Design Methodology
  
  巻: 15 号: 0 ページ: 16-19
- DOI
  10.2197/ipsjtsldm.15.16
- ISSN
  1882-6687
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Posit-Based Vision Transformer(ViT) Exploration at Edge Sites2022
- 著者名/発表者名
  Mery Diana
- 学会等名
  IEEE Symposium on Low-Power and High-Speed Chips and Systems(COOL Chips 25)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[備考] 知能システム研究室HP
- URL
  http://www.isys.cs.kumamoto-u.ac.jp/publication.html
- 関連する報告書
  2023 実施状況報告書
[備考] 熊本大学工学部情報電気工学科知能システム研究室HP
- URL
  http://www.isys.cs.kumamoto-u.ac.jp/
- 関連する報告書
  2022 実施状況報告書

エッジAIシステム向け設計基盤技術に関する研究

研究代表者

尼崎 太樹 熊本大学, 大学院先端科学研究部(工), 教授 (50467974)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] A Lightweight Deep Neural Network Using a Mixer-Type Nonlinear Vector Autoregression2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] `A Deep Neural Network Translator for Edge Site Implementation2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] A Posit Based Multiply-accumulate Unit with Small Quire Size for Deep Neural Networks2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[学会発表] Posit-Based Vision Transformer(ViT) Exploration at Edge Sites2022

著者名/発表者名

学会等名

関連する報告書

[備考] 知能システム研究室HP

URL

関連する報告書

[備考] 熊本大学工学部情報電気工学科知能システム研究室HP

URL

関連する報告書

尼崎太樹熊本大学, 大学院先端科学研究部(工), 教授 (50467974)