この研究において対象とする確率的学習アルゴリズムは、EMアルゴリズムとよばれるものである。従来、このアルゴリズムには対数演算が用いられていたが、学習速度において問題があった。そこで本研究においては、まずこのようなlog-EM法を拡張することを試み、その結果、学習の高速化を得ることができた(α-EMアルゴリズム)。 次に、上記のようなα-EM学習アルゴリズムと確率的自己組織化との間に、以下のような階層が存在することを確認した。 α EM→log-EM→{(逐次型、一括型)ベクトル量子化、確率的自己組織化}通常、ベクトル量子化では硬判定が行われるが、確率的自己組織化では軟判定が採用される。そして、自己組織化においては、その軟判定をひずみ測度で近似し、近傍系を導入して特徴マップを得ることが行われる。本研究においては、このような自己組織化を、画像の情報圧縮とそれに基づく仮想現実感の実現に適用した。その結果、2次元静止画像をその意味に基づいて動画像化し、3次元化することを可能にする手法を得た。 さらに、α-EMアルゴリズムは動画像中の領域の変化を認知する問題にも適用されており、次のような展開と結果が得られている。まず、取り扱う問題として、動画像の2フレーム間のオプティカルフローを求め、それに基づいて二つのフレーム間で時間的に変化する領域の検出と認識を実行することを取り上げた。このとき、各フレームはマルコフ的ランダム場とし、そして、各部分領域中のオプティカルフローは、アフィン変換に正規雑音が加わったものと仮定している。また、各ピクセルがどの部分領域に属するかの判定には、シグモイド型の軟判定を用いることにした。その結果、動画像中の領域判定が可能となった。
|