研究概要 |
近年,音声認識システムが携帯電話やカーナビゲーションシステムといった様々なアプリケーションの入力インタフェースとして用いられるようになってきている.そして,より多くのユーザが快適に音声認識システムを使用する為に音声認識に関する研究では更なる高精度化が求められてきている.本研究では,統計モデルであるHMMを用いた音声認識システムにおいて,扱う統計モデルの複雑さを向上させさらに学習アルゴリズムと包括して考えることでモデルの汎化性能をさらに向上させることを目的とした新しいモデル構造を提案し,その有効性を確認するものである.そこでベイズ基準の枠組みにおいて複数のパラメータ構造を用いることを考える.そのためにパラメータ構造を隠れ変数として含む新しいて関数を定義し,さらにその関数をより最適に学習させていくために確定的アニーリングという学習手法を用いてモデルの学習を行う.ただし,複数のモデル構造を段階的に構築していく手法ではないのでどのようなパラメータ構造を用いていくのかというのが大きな問題となる.そこでまず提案法の有効性を確認する為に2つのパラメータ構造を用いた実験を行いそれらの成果をまとめたものを英文誌に論文としてまとめて投稿した.さらに学習基準などの検討も進めていきつつ来年度には音声合成などの分野にも提案法を用いたものを適応していくことを目指すために近年音声合成の分野で期待されている話者性を考慮したクロスリンガル話者適応に関する研究にも着手し人間が話者性をどのように聞きわけているのか調査するような実験を行い更にモデル化も検討しその成果に関しても学会において発表を行った.
|