研究概要 |
画像や音声等のメディア情報処理においては,マルコフ性を考慮することが不可欠である.マルコフモデルを用いた多くのメディア処理では,直接観測される観測過程の下に,直接的には見えない隠れ過程の存在を仮定する.このような処理では,隠れ過程や観測過程の確率密度関数のパラメータ推定,モデルによって画像や音声が生成される確率の計算,隠れ過程の推定等が必要となる.因果的マルコフモデルでは,このような推定や確率計算のための効率の良いアルゴリズムが既に提案されているが,非因果的マルコフモデルに対してはまだない.本研究では初年度で,隠れ過程に平均場近似を適用することによって,非因果的マルコフモデルに対する高能率な計算アルゴリズムを提案した.提案法のポイントは,平均場を用いることによって,全体の隠れ過程や観測過程の確率,及び隠れ過程全体の事後確率も局所確率の積に分解できることにある.また,全ての隠れ状態に対する局所事後確率から構成される局所事後確率ベクトルを,具体的な平均場として利用できることを示した.次年度と最終年度では,提案アルゴリズムの有効性を評価するために,実際に画像処理と音声処理に適用した.画像処理では,非因果的マルコフモデルであるマルコフ確率場(MRF)モデルを用いるが,ウェーブレット変換画像に対してMRFモデルを適用する枠組みについて重点的に検討した.このアプローチは,これまでの原画像をMRFでモデル化する方法の問題点(主として,近距離の相互作用しか考慮できないことから派生する)を克服できる,極めて有効な方法であることがテクスチャ認識やテクスチャセグメンテーションを通して確認できた.また,音声処理では話者認識に適用し,逐次確率比検定を用いたオンライン認識による話者照合や話者識別での有効性を確認した.
|