研究概要 |
動画像理解に関する多くの処理は,現状の高速プロセッサを持ってしてもその処理速度要求を満たすことができない.本研究の目的は画像データから直接生成された回路を用いて,従来では不可能であった高速画像理解処理を実現することである.これは,従来の汎用プロセッサとソフトウェア処理による画像理解処理とは全く異なるアプローチである.この基本的なアイデアの有効性を評価するために「Parzen Window法」と「確率的ニューラルネットワーク」に着目した.両手法とも,多数のサンプル画像に基づく関数を用いる.この関数を回路化することで画像の直接回路化が可能となる.再構成可能集積回路(FPGA:Field Programmable Gate Array)をベースに試作機を作成し,以下を示した. 1)一様関数(Uniformed Function)を用いることでParzen Window関数が簡単な組み合わせ回路で実現できることがわかり,この関数をベースとした試作機を作成した.試作機はFPGAを用いた1,500,000ゲートレベルのシステムである.顔画像認識システムを本試作機に実装し,その動作速度を評価したところ,1マイクロ秒以下で1静止画像を90%以上の精度で認識できることがわかった. 2)確率的ニューラルネットワークの各ニューロンを上述した一様関数で置き換え,1)と同様にニューロンを回路化した試作機を作成した.本試作では,一部にメモリを使い仮想ニューロン化を行った.これにより,上述したParzen Window法による試作機より処理速度は低減されるが,コンパクトなシステム(1ボードシステム)が可能となった.ビデオ入出力まで含めた試作機を完成し,手の形(ジャンケン)の動画像を理解するシステムを作成し,70%程度の認識率を可能にした.
|