本年度は、画像認識の中でも、複数の3次元物体認識に関する研究を行った。 具体的には、複数の3次元物体を2次元射影像から認識することのできる並列階層型ニューラルネットワークの構築を行った。提案ネットワークは、生体の持つ優れた視覚システムの特徴である並列階層構造と記憶による認識の補助に着目し、視覚システムの並列階層構造をモデル化したネオコグニトロンを参考にしている。細胞間で競合を行い重要度の低い細胞を削除し、各細胞が異なる特徴を抽出することで計算量を削減している。また、物体の認識だけでなく、同時に姿勢の推定を行うことができる。姿勢の推定結果をもとに入力画像を学習画像に近づけていく繰り返し処理が行われ、記憶による認識の補助をモデル化している。学習は、学習画像を順に提示していくことで行われ、教師信号は不要である。これは繰り返し学習法ではないため短時間で行われる。ネットワークの性能の評価を、COIL-100からの5物体を用いて行った。学習画像には、各物体を鉛直軸周りに60度おきに回転させ撮影した画像を用いた。実験では、3次元物体から得られる様々な2次元射影像に対する認識率を調べた。この結果から、3次元物体認識手法としての有効性が確認された。
|