研究概要 |
近年のマルチメディアシステムや自動走行車をはじめ,利用者(あるいはシステム中枢)の高度な推論や計画といった記号レベルの処理を支援する目的で画像認識・理解を応用する分野が増えている.視覚探索は,これらの応用において最も基本的で重要な機能である. 本研究は,代表者が提案中の多層ニューラルネットワーク(多層NN)を用いた画像認識システムを応用し,より高度で柔軟な視覚探索を可能にするモデルを構築し,視覚探索の応用領域の拡大を図るものである.この多層NNは,画像が入力されると対象物の形や色,動きの方向など抽象度の高い属性概念(記号的概念)を出力する.この多層NNは,入力(画像)から出力(属性記号)へ情報が1方向に流れる通常の多層NNと異なり,情報が入出力間を双方向に流れる.この機能により,予め目標物の属性概念の「一部」が入力(指定)されていると,背景などの不要な視覚情報(妨害刺激)を抑制して必要な情報だけを選択的に処理するようになり,目標物を安定にかつ効率的に「残り」の属性概念を出力する.これにより,目物の検出能力が向上するばかりでなく,目標物を記号的概念を用いて指定するという高度なヒューマンインターフェイスを持つ視覚探索システムの構築が可能になる. 本研究の最終段階では,移動中の自動車から撮影したビデオ画像をもとに道路状態を監視し,数種類の危険状態を警告する問題を設定する.そのための準備として,本年度は,以下の3項目に重点をおいて研究を行った. 1.初期視覚の実装:本システムは,目標物のさまざまな属性概念を抽出するために距離画像,速度ベクトル画像,輪郭画像,色分類画像などを入力とする.これらの入力画像を統一的に抽出することができる初期視覚システムをワークステーション上に実装した. 2.属性概念の選定:代表者らは,すでに目標物を特定するための簡単な属性概念を用いて基礎実験を行っている.更に視覚探索の精度を向上させるために,属性概念を視覚心理学の立場から検討し直した. 3.並列計算機への実装:本方式は,現在のワークステーションの演算処理能力では,実時間性が重要視される応用に対しては実用的な性能は発揮できない.そこで,高速ATMネットワークを用いたワークステーションクラスタ環境での実装の準備を行った.
|