研究概要 |
画像や音声等のメディア情報処理においては,マルコフ性を考慮することが不可欠である.マルコフモデルを用いた多くのメディア処理では,直接観測される観測過程の下に,直接的には見えない隠れ過程の存在を仮定する.このような処理では,隠れ過程や観測過程の確率密度関数のパラメータ推定,モデルによって画像や音声が生成される確率の計算,隠れ過程の推定等が必要となる.因果的マルコフモデルでは,このような推定や確率計算のための効率の良いアルゴリズムが既に提案されているが,非因果的マルコフモデルに対してはまだない.本研究では昨年度,隠れ過程に平均場近似を適用することによって,非因果的マルコフモデルに対する高能率な計算アルゴリズムを提案した.本年度は,提案アルゴリズムの有効性を評価するために,実際に画像処理と音声処理に適用した.画像処理では,非因果的マルコフモデルであるマルコフ確率場(MRF)モデルを用いた.画像の多重解像度処理やMRFによるモデル化の適性を考慮して,ウェーブレット変換画像に対してMRFモデルを適用するアプローチをとった.提案モデルの有効性は,特にテクスチャ画像処理において顕著であると考えられることから,テクスチャ認識とテクスチャセグメンテーションに適用した.実験の結果,提案モデルが高い認識性能とセグメンテーション性能を有することが確認された.音声処理では話者認識に適用し,統計的逐次決定法を用いたオンライン認識による話者照合(発声者が名乗った本人か否かを判定)で評価を行った.これまで,逐次決定法を用いた話者照合では,確率計算の点でマルコフ性の導入が困難であったが,平均場近似のもとではそれが可能となり,照合正解率が向上した.
|