研究課題
最終年度は、【10】ASIC化の課題であるCGRAチップ間インタフェースのFPGA非依存設計と高速化を行い、それまで5Gbps*3レーンであった構成を5Gbps*8レーンに増強できた。また、副産物として、それまで32KBであった各ユニットのローカルメモリを64KBに倍増でき、高性能化に大きく寄与した。さらに、ローカルメモリの連続アドレスから2つの単精度浮動小数点データを一度にロード(SIMD-LOAD)する場合、先頭アドレスが64bit境界でなければならなかった制約をデュアルポートメモリの工夫により撤廃した。この機能拡張により、畳み込み演算では利用が困難であったSIMD-LOADが全面的に利用可能となり、高速インタフェースの利用と合わせて、性能をさらに約2倍に向上できた。最終的には、新たに開発したFPGA間接続高速インタフェースおよび大規模FPGAボード4枚を利用して、内部動作周波数(140MHz)および外部インタフェース性能(35.8Gbps)がともに、28nm想定ASIC(3mm角)4個連結構成の1/6となるプロトタイプの開発を完了した。測定の結果、プロトタイプの単精度浮動小数点演算性能は、NVIDIA製Jetson TX2に比べて、480x480の行列積では5.6倍、242x242(ICH=18,OCH=16,K=3x3)の畳み込み演算では6.2倍となった。また、外部メモリバンド幅あたり性能は、TX2(主記憶バンド幅480Gbps)に比べて、各々、76倍と83倍となった。同様に、ASIC化した場合の見積り性能は、NVIDIA製GTX1080Tiに比べて、行列積では1.8倍、畳み込み演算では2.0倍となった。【11】VBGMM法のCGRA化では、前述のように、GPUでは高速化が難しい指数関数の総和を求める部分に適用し、高速化が可能であることを確認した。【12】ストカスティック近似計算手法のCGRAへの統合に取り組み、DiaNETアーキテクチャシリーズを多数考案して、高効率性を確認した。
令和2年度が最終年度であるため、記入しない。
すべて 2021 2020 2017 その他
すべて 雑誌論文 (10件) (うち査読あり 10件) 学会発表 (3件) (うち招待講演 1件) 備考 (1件) 産業財産権 (4件) (うち外国 2件)
IEICE Transactions on Electronics
巻: Vol.E104-C, No.7 ページ: -
10.1587/transele.2020CDP0002
巻: Vol.E104-C, No.5 ページ: -
10.1587/transele.2020ECP5015
CANDAR'20
巻: CANDAR'20 ページ: -
10.1109/CANDARW51189.2020.00032
IEICE Transactions on Information and Systems
巻: E103.D ページ: 2072~2082
10.1587/transinf.2019EDP7326
IEEE Int. System-on-Chip Conf., pp.225-230, Sep. 8th-11th
巻: ISOCC2020 ページ: 225-230
SigTelCom2020, Aug.
巻: SigTelCom2020 ページ: -
10.1109/SigTelCom49868.2020.9199057
2020 IEEE Computer Society Annual Symposium on VLSI (ISVLSI)
巻: ISVLSI2020 ページ: -
10.1109/ISVLSI49217.2020.00026
The 18th IEEE International NEWCAS Conference
巻: NEWCAS2020 ページ: -
10.1109/NEWCAS49341.2020.9159845
IEEE International Symposium on Circuits & Systems
巻: ISOCS2020 ページ: -
10.1109/ISCAS45731.2020.9180624
http://arch.naist.jp