研究概要 |
脳における動的視覚情報処理の仕組みを解明し,そのメカニズムを取り入れたパターン認識システムの新しい設計原理を開発することを目指して研究を進めた。 そのなかでも特に,顔認識能力を持つ神経回路モデルの構築に重点を置いて研究を進めた.このモデルは,複雑な背景を持った画像中から顔を見つけだし,さらに目や口に注意を集中してその形状を切り出す能力を持っている.ところで顔画像の中では,顔の全体的な構造に関する情報は主に低空間周波数領域に,目や口などの詳細な部分構造に関する情報は高空間周波数領域に分かれて存在している.そこで,高低二つの解像度のチャネルをもつ神経回路モデルを構築し,顔のおおまかな構造を扱う低解像度のチャネルと,目や口の詳細な形状を扱う高解像度のチャネルとが,互いに信号をやりとりしながら情報を処理していくようにした.画像の中から目や口の形状の抽出できれば,その情報をもとに,顔の位置,目の大きさ,目と目の間の距離などのパラメータを読みとることは容易である.従って,本研究の成果と,従来より開発されてきた顔認識の手法とを組み合わせて用いることにより,個人識別や,表情認識など,様々な面での応用の可能性が広がると考えられる. またこれと並行して,当研究グループで研究を進めてきたパターン認識システム「ネオコグニトロン」を,実世界の文字認識に適用するための研究も進めた.このために,手書き数字の大規模データベースETL-1を用いて認識率を評価しながら回路構造や学習方式に改良を加えた.特に,脱抑制機構を持つ特徴抽出回路を用いることによって,線分の交点や折れ点を検出する能力を向上できることを明らかにした.
|