画像から周囲環境を認識するために物体輪郭推定と距離(視差)推定を同時に行う畳み込みニューラルネット(CNN)を考案し、FPGA(Field Programmable Gate Array; 手元で書き換え可能な集積回路)に実装した。輪郭検出を、従来の輪郭・非輪郭の二値分類ではなく、物体境界からの距離を推定する回帰問題へ帰着させ、視差推定とのマルチタスク学習を可能とした。そして二つの推定を同時に行う全重み共有のCNNを考案した。これを3ビットまで量子化したが、精度低下は僅かであった。FPGA実装の結果、250 MHzで動作し、480×320画素の画像に対するスループットは134 fpsであった。
|