研究概要 |
視覚情報処理の重要な課題の1つである不変・多態認識の問題に,視覚的注意への概念・空間関係の導入に基づく注意のレベルと関係の識別・及びベイジアンブレインモデリングに基づく注意対象の不変・多態符号化とシンボル接地という側面からアプローチし,新しい不変・多態認識のモデルとその応用知能システムを構築することを目的として研究を行っている.本年度は,3年計画の研究の初年度であり,まず,動画像の各フレームに対して計算される視覚注意ピラミッド上で確率的な注意の選択とシフトを遂行する視覚注意の計算モデルを構築した,本モデルは,ガウシアン解像度ピラミッド上で,明度コントラスト・彩度コントラスト,色相コントラスト,方位とフルモーションエネルギーを視覚特徴量として計算し,それらを用いて希少性基準と呼ぶ顕著度判定基準に従って視覚注意ピラミッドと名づける多レベル顕著性マップを生成する.そして,動的なIOR(Inhibition Of Return),局所的なボトムアップ空間注意・適応的でグローバルな競合により顕著度を調節した視覚注意ピラミッド上で,確率的な注意の選択とシフトを遂行する.ビデオクリップを用いた実験により,本モデルが,確率的な視覚ポップアウトを達成すること,注意を引くべく設計された対象に対して高い確率で注意を向けること,人物を含む日常の動的シーンにおいて,対象の全体部分関係に沿い,かつ対象の動きに追従する妥当な注意の選択とシフトを遂行することを示した.次に,動画像に対する注意に基づくダイナミックなセグメンテーションを,視覚特徴量により定義されるマルコフ確率場上でSMC(Sequential Monte Carlo)によりセグメントラベルを逐次ベイズ推定する問題として定式化した.また,それらセグメントの全体部分関係からセグメントのグルーピングを行い,オブジェクトの認識を行う方法を定式化した.
|