本研究では、応用システム要求に応じて柔軟に構造を変更しつつ、高速な識別処理を実現する機械学習専用のハードウェアエンジンを実装した。サポートベクタマシンの識別能力を維持しつつ大幅な高速化が可能であるソフトカスケード処理を適用し、データの次元数、演算精度を変更することができる再構成可能アーキテクチャとして実装した。FPGAならびに45nmテクノロジで実装した結果、要求性能に応じた構成が採れることを確認するとともに、FPGA版175.7MHz動作にて、毎秒79VGAフレーム7HDフレームの処理能力を持ち、45nm版では、最大毎秒361VGAフレーム35HDフレームの処理が可能であることを確認した。
|