2016 Fiscal Year Annual Research Report
VLSI Implementation of Generic Hardware for Machine Learning
Project/Area Number |
26330065
|
Research Institution | Osaka University |
Principal Investigator |
尾上 孝雄 大阪大学, 情報科学研究科, 教授 (60252590)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | VLSI / 機械学習 / アーキテクチャ |
Outline of Annual Research Achievements |
昨年度までに得られている設計結果にもとづき、今年度はサーバ・端末協調による識別処理フレームワークの構築を進めた。本フレームワークは、ACF (Aggregated Channel Features) ならびに BDT (Boosted Decision Tree) に基づくものである。入力画像から、色々な Channel を生成するが、Aggregated Channel を用いることで、性能劣化を抑えつつ必要となるメモリ容量を削減することができる。また、段数2の決定木をウィンドウサイズに応じて、多段で接続することにより、例えば、自動車(弱識別器数512)、歩行者(同2,048)、信号機(同512)など、統一的なハードウェアで全ての物体を取り扱うことが可能である。 また、統合化認識フレームワークをハードウェア用に Xilinx Kintex7 FPGA、ソフトウェア用にARM Cortex-A9プロセッサを集積しているZynq7000(XC7Z045)搭載ボードにSoC実装した。3コア並列動作させた場合のFPGAリソース利用率は63.68%(LUT)である。本実装では、同一の認識コアハードウェアを用いて、多種の物体を認識する。このため、ハードウェアとソフトウェアの協調動作が必要となる。まず、全ての種類の物体識別に必要となるパラメータを外部から内部メモリにロードする。これと同時に、ハードウェアでは ACF チャネルの生成ならびに特徴量生成を行う。その後、各種の物体のパラメータのハードウェアへのロードと識別処理を繰り返し行っていく。前者には約4ms必要となり、各識別処理には、0.09-0.15ms必要であった。 本システムの動作評価には、画像認識に基づく運転者補助手法を用いた。対向車、前方車、歩行者、3色信号の全ての識別処理を行った場合でも、HD画像のマルチスケール処理に必要な時間は13.49msとなり、毎秒74フレームの処理が可能であるため、実装したシステムでリアルタイム処理が可能であることを確認した。
|