研究課題
FPGAを用いたドメイン特化計算の高効率化を目的に、性能最適化が容易なハードウェア高位設計フレームワークの実現を目指して研究を進めた。2022年度は、公開成果物のハードウェア設計フレームワークVeriloggenの拡張と最適化、および実アプリケーションへの応用に取り組んだ。FPGAによる計算高速化では、データパスに効率的にデータを供給するメモリシステムが重要となる。一般的な高位合成ツールにおいては、オンチップメモリとオフチップメモリ間のデータ転送を計算本体をオーバーラップさせ、データ転送の遅延を隠蔽することは容易ではなく、遅延隠蔽をするハードウェア記述はプログラマの負担を大きく増やすことになる。本年度は、データ転送と計算のオーバーラップを意識しない容易なハードウェア記述から、データ転送と計算をオーバーラップさせて計算を行う効率的なハードウェアを自動的に合成する高位合成技術を開発した。計算とデータ転送を逐次的に行う記述を入力として、ソースコード静的解析によりデータパス稼働時にアクセスするオンチップメモリ領域を特定する。そして、未使用のオンチップメモリ領域に先行的にオフチップメモリからデータを転送し、データ転送完了後にデータパスからアクセスするアドレスを張り替えることでデータ転送遅延を隠蔽する。また、間接参照を含む場合でも計算とデータ転送をオーバーラップさせるための、計算とデータ転送の軽量な同期方式を開発した。密行列積や疎行列積等において性能向上を確認した。また、Veriloggenの実アプリケーションへの応用として、単眼動画像を入力とする奥行き推定のFPGAベースアクセラレータを開発した。開発にはVeriloggenをバックエンドに持つDNNハードウェア高位合成コンパイラNNgenを用いることで、短期間で高性能なシステムを開発できることを示した。
令和4年度が最終年度であるため、記入しない。
すべて 2023 2022 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (9件) 備考 (3件)
International Conference on Field Programmable Technology (FPT 2022)
巻: - ページ: 1-9
10.1109/ICFPT56656.2022.9974565
10th International Workshop on Computer Systems and Architectures (CSA 2022)
巻: N/A ページ: 90-96
10.1109/CANDARW57323.2022.00062
International Symposium on Highly-Efficient Accelerators and Reconfigurable Technologies 2022 (HEART 2022)
巻: N/A ページ: 24-32
10.1145/3535044.3535048
https://github.com/PyHDI/veriloggen
https://github.com/NNgen/nngen
https://github.com/casys-utokyo/fadec