研究課題
基盤研究(B)
深層学習プロセッサ用デュアルポートSRAMを28nm FD-SOIプロセスによって実装した。画像データの読み出し動作にかかるエネルギを14.76%削減可能であることを確認した。この技術を深層学習プロセッサのコードブック量子化用20トランジスタ超多ポートSRAMに拡張した。8ビットを16ビットに変換するルックアップテーブルとして機能する4kビットコードブックを40nmプロセスで試作した。モチーフとするNVIDIA NVDLAプロセッサにおいて20%のエネルギと26%の面積を削減した。
IoTデバイスの低エネルギ画像認識の需要は機械学習により様々な分野で拡大している。カメラの高解像度化に反して、低エネルギ処理とリアルタイム性維持の両立が求められている。深層学習プロセッサは大量のパラメータと入出力を扱うため、大容量の内部SRAMが必要となり、シリコン面積の50%以上を占め、エネルギは外部DRAM帯域に支配される。精度を落とさずにメモリ帯域を削減する方法として量子化がある。コードブック方式は任意の非線形関数を表現でき、線形量子化よりも精度劣化を抑えることができる。この用途のために深層学習プロセッサのコードブック量子化用20トランジスタ超多ポートSRAMを設計、試作した。
すべて 2021 2020 2019 2018 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (7件) (うち国際学会 3件、 招待講演 1件) 備考 (1件) 産業財産権 (1件)
JLPS Journal of Laser Micro / Nanoengineering (JLMN)
巻: 16 ページ: 150-154
10.2961/jlmn.2021.02.3001
IEEE Transactions on Circuits and Systems I: Regular Papers
巻: 66 号: 4 ページ: 1442-1453
10.1109/tcsi.2018.2885536
IEEE Transactions on Circuits and Systems I
巻: 印刷中
120007026371
https://www28.cs.kobe-u.ac.jp/