2000 Fiscal Year Annual Research Report
マルコフモデルを用いたメディア情報処理における平均場近似の適用
Project/Area Number |
10650370
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
野田 秀樹 九州工業大学, 工学部, 助教授 (80274554)
|
Co-Investigator(Kenkyū-buntansha) |
河口 英二 九州工業大学, 工学部, 教授 (90038000)
|
Keywords | マルコフモデル / メディア情報 / 平均場近似 / MRF / ウェーブレット変換 / テクスチャ / 話者識別 / 逐次確率比検定 |
Research Abstract |
画像や音声等のメディア情報処理においては,マルコフ性を考慮することが不可欠である.マルコフモデルを用いた多くのメディア処理では,直接観測される観測過程の下に,直接的には見えない隠れ過程の存在を仮定する.このような処理では,隠れ過程や観測過程の確率密度関数のパラメータ推定,モデルによって画像や音声が生成される確率の計算,隠れ過程の推定等が必要となる.因果的マルコフモデルでは,このような推定や確率計算のための効率の良いアルゴリズムが既に提案されているが,非因果的マルコフモデルに対してはまだない.本研究では一昨年度,隠れ過程に平均場近似を適用することによって,非因果的マルコフモデルに対する高能率な計算アルゴリズムを提案した.本年度は昨年度に続いて,提案アルゴリズムの有効性を検証するために画像処理や音声処理に適用すると共に,本研究全体のまとめを行った.画像処理では,非因果的マルコフモデルであるマルコフ確率場(MRF)モデルを用いるが,ウェーブレット変換画像に対してMRFモデルを適用する枠組みについて検討した.このアプローチは,これまでの原画像をMRFでモデル化する方法の問題点(主として,近距離の相互作用しか考慮できないことから派生する)を克服できる,極めて有効な方法であることがテクスチャ認識やテクスチャセグメンテーションを通して確認できた.このアプローチは,マルチスペクトル画像の多重解像度処理に帰着され,これに平均場近似を適用することになる.また,話者認識では新たに,多クラス分類問題である話者識別への適用方法を研究した.その結果,話者識別においても,話者や発声内容に依存した適応的な処理(発声長制御)を実現することができた.
|
-
[Publications] Mahdad N.Shirazi: "Texture classification based on Markov modeling in wavelet feature space"Image and Vision Computing. 18. 967-973 (2000)
-
[Publications] ヌリシラジマハダド: "ウェーブレット特徴空間でMBFモデルを用いたテクスチャ認識"電子情報通信学会論文誌. J83-D2. 1995-2002 (2000)
-
[Publications] 野田秀樹: "逐次確率比検定を用いた適応的話者識別"電子情報通信学会論文誌. J84-D2. 211-213 (2001)
-
[Publications] Hideki Noda: "Adaptive speaker identification using sequential probability ratio test"Proceedings of International Conference on Pattern Recognition. 3. 266-269 (2000)
-
[Publications] Mahdad N.Shirazi: "Markov modeling of textures in wavelet feature space"Proceedings of IEEE International Conference on Image Processing. (2000)
-
[Publications] Hideki Noda: "Textured image segmentation using MRF in wavelet domain"Proceedings of IEEE International Conference on Image Processing. (2000)