2016 Fiscal Year Annual Research Report
Study on deep learning hardware construction method based on synchronous shift data transfer
Project/Area Number |
26330060
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
北澤 仁志 東京農工大学, 工学(系)研究科(研究院), 教授 (60345329)
|
Co-Investigator(Kenkyū-buntansha) |
富岡 洋一 会津大学, コンピュータ理工学部, 准教授 (10574072)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ディープラーニング / FPGA / リコンフィギャラブルシステム / 物体識別 / 移動物体抽出 |
Outline of Annual Research Achievements |
本研究はディープラーニング(DNN)の高速処理と高性能化のために,FPGAを用いた並列処理ハードウェアによるDNNの高速処理を目指した. 平成26年度はSIMDアレイでの並列処理手法としてメモリアクセス競合やバス競合を生じない“同期シフトデータ転送”を適用したDNN回路をFPGA上に実装した.処理速度は1フレーム当たり前進解析で5.1ms,誤差逆伝搬で14.1msであり,処理速度ではGPUを超えることはできなかったが,DNNの前進解析部を動画像中の移動物体の識別に適用し,移動物体抽出と同じSIMDアレイ上で付加回路を必要とせずにDNNによる物体識別ができることを示した. 平成27年度は,スループット1クロックのパイプライン式積和演算器を用いたDNNの高速処理回路を実現した.回路全体のスループットは1ピクセル/1クロックであり,320×240の車載カメラ画像中の前走車両の接近識別において識別率99.0%,約1600フレーム/秒の処理速度を実現した.演算速度は409GOPSであり,この時点での1チップ構成の最速を達成した.SIMDアレイ形式では,1枚のFPGAボードでカメラ64台の映像を処理するMulti-Stream Trackingを実現し,人,車両,背景の3物体の識別時間3.7msec,識別率94%を得た. 平成28年度は,先ず,実データでの識別率低下を防ぐため,学習データからラベルミスやアウトライヤなどの欠陥を取り除く方法を考案した.これにより実データの識別率が1.5%~3.0%改善できた.次に,SIMDアレイにおいて畳込みフィルタの重みを全PEに持たせるのでなく,1つの代表PEからブロードキャストする形式とした.これによりメモリ利用効率が向上し,フィルタの数,サイズを拡張でき,5物体での識別率を89.2%から92.4%に改善した.
|
Research Products
(2 results)