研究課題/領域番号 |
22K11956
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60040:計算機システム関連
|
研究機関 | 熊本大学 |
研究代表者 |
尼崎 太樹 熊本大学, 大学院先端科学研究部(工), 教授 (50467974)
|
研究分担者 |
木山 真人 熊本大学, 大学院先端科学研究部(工), 助教 (30363534)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | DNNコンパイラ / NVAR Mixer / エッジAI / 深層学習週 / ニューラルネットワーク / 集積回路 / コンパイラ / 深層学習 |
研究開始時の研究の概要 |
IoTの普及により,現場にあるエッジ端末が無線通信でデータを収集し,クラウドに自動でアップできる環境が整ってきた.こうした中,通信量,機密性,実時間応答性の観点より,エッジ側で知的な処理を行うエッジAIコンピューティングが注目されている.一方,電力,メモリ,速度などあらゆる計算リソースに制約がかかる汎用プロセッサでは,深層学習技術を十分に活用することが難しい.本研究では,高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できる,エッジAI向け設計基盤技術の確立を目的とする.
|
研究実績の概要 |
高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できるエッジAI端末,および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とした.2023年度はエッジAI向けのDNNモデル開発およびDNNコンパイラ開発を行った.DNNモデルにおいては,従来のCNN(Convolutional Neural Network)とは異なる形で,リザバーコンピューティングモデルの数学的等価モデルであるNVAR(非線形ベクトル自己回帰)をベースとした混合型モデルを提案し,その評価を行った(このモデルをNVAR-Mixerとよぶ).本モデルではオーバーラップパッチ埋め込みを適用し,Mixer型NVARの内部で垂直方向と水平方向の操作を行うためにシーケンサーアーキテクチャを適用した.提案モデルの性能を向上させるために,ウィンドウ分割技術と一般的な2次位置エンコーディングを採用した.提案モデルは,0.159MパラメータのCIFAR-10データセットに対して分類精度82.48%,0.106MパラメータのMNISTに対して分類精度98.36%のトップ1精度を達成した.さらに,CPUでのスループットを評価したところ,CIFAR-10データセットでは190.1画像/秒,MNISTデータセットでは106.7画像/秒であった.これらの認識精度は,最新の畳み込みニューラルネットワークベースのモデルであるMLP-Mixerや,ハイパーパラメータを同じチューニングにした従来のリザーバーコンピューティングベースのMixerモデルと競合するものである.また,DNNコンパイラにおいてはPytorchで開発したAIモデルをXilinx Vitis(高位合成ツール)に直接合成可能なC++を生成するトランスレータを開発し,その動作を確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,高い処理能力や大規模メモリを前提とした従来の計算原理とは異なり,多様化するAIモデルに柔軟に対応できるエッジAI端末,および設計プラットフォームを含めたのエッジAI向け設計基盤技術確立を目的とする. 初年度にPosit化の基礎検討を行い,そこで従来には無い新たなDNNモデルの必要性が生じ,それに向けてNVAR-Mixerを提案し,その効果を示すことができた.実際にこれらの評価結果をIEEE Accessに投稿し,2023年10月にアクセプトされた.DNNコンパイラにおいても現在,PytorchからVitisまでシームレスに合成可能なトランスレータのプロトタイプ設計および評価が完了し,現在は論文誌へ投稿している状況である.
|
今後の研究の推進方策 |
申請書の経緯に沿って,概ね研究が進んでいる.2024年度は最終年度のため,NVAR-Mixerの応用および,本アーキテクチャをベースとしたオブジェクトディテクションモデルへの発展を検討していく.廉価版のFPGA(Field Programmable Gate Array)を対象に,NVAR-Mixerの実装評価を行い,物理性能を評価する予定である.同様にDNNコンパイラに関しては,可能であればMLIRを用いた論理最適化を行い,現状のトランスレータ版と比較して,最終的な回路性能が向上することを確認する.上記2つを明らかにすることで,エッジ再度のAI設計手法(超軽量なDNNアーキテクチャ,および回路設計技術)の基礎を明らかにすることを目的とする.
|