統計的手法を用いたパターン認識は、現実世界の不確かな現象をコンピュータで取り扱う有効な方法であり、音声認識など様々な分野で有効な方法として用いられている。この枠組みでは学習用のデータから確率モデルを推定し、そのモデルをもとに新たな入力データに対し確率推論を行うことが基本となる。そこで、よりよい性能を得るためには限られた学習データからできる限り精密かつ汎化性のあるモデルを学習することが非常に重要となる。 本研究ではモデル学習の際の目的関数を従来の自己尤度からクロスバリデーション尤度に置き換えることで、学習アルゴリズムの汎化性能を強化し、複雑なモデルを少ないデータから精度良く推定することを目的としている。このような目的のもと今年度においては、モデルパラメタ最適化法としてAggregatedEM法の提案の提案を行った。 Aggregated EM 法は従来提案したCV-EM法の拡張で、アンサンブル手法をEM法の繰り返しアルゴリズム内部に取り入れることで、複数のモデルの結果を総合・平滑化し、モデル推定精度の向上を図る手法である。また、モデル構造最適化法としてクロスバリデーション尤度に基づく混合ガウス分布の最適化手法、およびそれを発展させた、Aggregated cross-validation尤度を用いた混合ガウス分有最適化アルゴリズムの提案の提案を行った。 従来クロスバリデーション尤度は計算量が多く応用が限られていたが、これら提案手法は十分統計量を用いることで効率的に動作し、大規模なモデルに対して現実的な計算量で適用が可能である特徴がある。大語彙連続音声認識に用いる大規模な隠れマルコフモデル(HMM)へこれら提案手法を適用し、モデル良能向上に有効であることを示した。
|