研究概要 |
【研究目的】 本研究では,パターン認識システムの精度とシステムを使用する環境の変動に対する頑健性を効率的に向上させるために,逐次的に得られるデータの性質に応じて,認識システムに用いる確率モデルの構造と分布パラメータを適応的に最適化する方式の開発を目指す.さらにこの枠組みを,音声情報と顔画像情報を用いた人物認識(話者認識)システムに適用することを試みる. 【研究方法・研究成果】 本年度は,逐次入力される学習データの性質に応じて混合正規分布(GMM)の混合数を適応的に制御しながら分布パラメータの最適化を行う枠組みを構築した.この枠組みを顔画像を用いた人物認識システムに適用することで,基本的な知見を得た.具体的な検討項目と成果は下記の通りである. (1) モデル構造とパラメータの同時最適化 変分ベイズ法によりGMMのモデル構造(混合数)と分布パラメータ(平均・分散・重み)を同時に最適化するシステム(学習器)を構築した.これにより,学習データを取得する度にシステムを適応的に最適化することが可能となった. (2) 変分ベイズ予測に基づく識別器の構築GMMを用いた人物認識のための識別器として,変分ベイズ予測に基づく識別器を構築した. (3) 人物認識システムへの適用 (1)および(2)で構築したシステムの評価を,顔画像を用いた人物認識において行った.撮影環境が異なるデータが日々蓄えられる(学習データとして追加される)度に,GMMの分布パラメータと混合数を同時に最適化する実験を行ったところ,以下の結果を得た. ・撮影環境が具なるデータが学習データとして追加されることで,最適なモデル構造(混合数)が変化する. ・モデルのパラメータのみならず構造(混合数)も同時に最適化することで,構造を最適化しない最尤学習/最尤識別に基づくアプローチの誤りを削減することに成功した.
|