研究概要 |
本研究は,複数の物体が存在する自然画像において,細かい構造に血関係に大局的な領域を分割・抽出し,分割領域の関係性を理解・認識することにより情景理解を行うモデルとアルゴリズムを開発することを目的とする。今年度は主に集積回路化に適した高次認識用モデルとアルゴリズムの開発を行った。 大局的分割された各領域の相互関係について,ある物体が別の物体で一部隠蔽されて分割された場合に,Terman-Wangの非線形振動子ネットワークの発火同期性を利用して,分割領域を同時抽出る方法を検討した。このネットワークは申請者らが開発したアナログ・デジタル融合回路方式により集積回路化した実績のあるモデルである。まず,分割された領域の輝度がほぼ等しいことに着目し,振動子を表現する微分方程式に画素の輝度に依存する項を新たに追加することにより,同一の輝度を有する領域を同時発火させることに成功した。しかし,この方法は領域間の関係性を用いていないので,全く無関係の物体領域がたまたま同じ画素輝度を有していても同時発火する可能性がある。 そこで,領域境界を辿って領域間の関係を理解するモデルを研究した。この際に問題になるのが,照明などの具合で境界(エッジ)が途切れている場合である。人はこのような場合でもエッジを補完して情景画像を認識する。エッジのないところにエッジを認識する機能を「主観的輸郭」と呼ぶが,これを実現するモデルを考案した。まず,脳の初期視覚野の機能として知られているガボールフィルタによって特定方向のエッジを検出する。次に,あるエッジが途切れている場合に,それを拡散方程式により外挿していき,途切れたエッジを接続する。これにより,主観的輸郭を実現することができる。現在,このモデルを集積回路化することを検討中である。
|