研究概要 |
画像や音声等のメディア情報処理においては,マルコフ性を考慮することが不可欠である.マルコフモデルを用いた多くのメディア処理では,直接観測される観測過程の下に,直接的には見えない隠れ過程の存在を仮定する.このような処理では,隠れ過程や観測過程の確率密度関数のパラメータ推定,モデルによって画像や音声が生成される確率の計算,隠れ過程の推定等が必要となる.因果的マルコフモデルでは,このような推定や確率計算のための効率の良いアルゴリズムが既に提案されているが,非因果的マルコフモデルに対してはまだない.本研究では一昨年度,隠れ過程に平均場近似を適用することによって,非因果的マルコフモデルに対する高能率な計算アルゴリズムを提案した.本年度は昨年度に続いて,提案アルゴリズムの有効性を検証するために画像処理や音声処理に適用すると共に,本研究全体のまとめを行った.画像処理では,非因果的マルコフモデルであるマルコフ確率場(MRF)モデルを用いるが,ウェーブレット変換画像に対してMRFモデルを適用する枠組みについて検討した.このアプローチは,これまでの原画像をMRFでモデル化する方法の問題点(主として,近距離の相互作用しか考慮できないことから派生する)を克服できる,極めて有効な方法であることがテクスチャ認識やテクスチャセグメンテーションを通して確認できた.このアプローチは,マルチスペクトル画像の多重解像度処理に帰着され,これに平均場近似を適用することになる.また,話者認識では新たに,多クラス分類問題である話者識別への適用方法を研究した.その結果,話者識別においても,話者や発声内容に依存した適応的な処理(発声長制御)を実現することができた.
|