2006 Fiscal Year Annual Research Report

統計的音声認識・合成のための次世代音響モデリング

Research Project

Project/Area Number	18800019
Research Institution	Nagoya Institute of Technology
Principal Investigator	全炳河名古屋工業大学, 工学研究科, 研究員 (60432291)
Keywords	音声認識 / 音声合成 / 音響モデル / 隠れマルコフモデル / トラジェクトリモデル / ベイズ学習 / 話者適応 / セミマルコフモデル
Research Abstract	統計的音声認識や音声合成における音響モデルとして広く用いられている隠れマルコフモデル(HMM)の本質的限界としては,以下の3点がある.(1)状態内で統計量が一定であり,状態内での時間変化をモデル化できない.(2)観測ベクトル間の時間的独立性を仮定しており,時間的な依存関係を表現できない.(3)状態持続時間長確率分布が幾何分布であり,実際の音声の持続時間特性をモデル化できない.これらの問題は,HMMにおける仮定である,状態内での統計的定常性・観測ベクトル間の条件付無相関性・1次のマルコフ過程,に関するものである.HMMの取り扱いの容易さと実装可能性は,これらの仮定によっているものの,実際の音声パラメータ列では成り立たないものである.そこで,本年は,一つ目及び二つ目の問題を同時に解決可能な新しい統計モデリング手法であるトラジェクトリHMMを導入し,これを用いて音声認識・合成を行うための各種アルゴリズムを整備した.具体的には,モンテカルロEMに基づく学習アルゴリズム及び特徴量空間・モデル空間における線形変換を用いた話者適応アルゴリズムを導出した.また,これらのアルゴリズムを実際に音声認識に適用・評価し,国際会議等で発表した.三つ目の問題を解決できる隠れセミマルコフモデル学習のための各種ツールの整備を行い,最新の音声合成システムに組み込み,音声合成システムの国際的な評価会に参加し,優秀な成績を収めた.

Research Products
(2 results)

All 2007

All Journal Article (2 results)

[Journal Article] Reformulating the HMM as a trajectory model by imposing explicit relationships between static and dynamic feature vector sequences2007
- Author(s)
  Heiga Zen
- Journal Title
  
  Computer Speech and Language Vol.21 No.1
  
  Pages: 153-173
[Journal Article] Details of Nitech HMM-based speech synthesis system for the Blizzard Challenge 20052007
- Author(s)
  Heiga Zen
- Journal Title
  
  IEICE TRANSACTIONS on Information and Systems Vol.E90-D No.1
  
  Pages: 325-333

2006 Fiscal Year Annual Research Report

統計的音声認識・合成のための次世代音響モデリング

Principal Investigator

全 炳河 名古屋工業大学, 工学研究科, 研究員 (60432291)

Research Products

[Journal Article] Reformulating the HMM as a trajectory model by imposing explicit relationships between static and dynamic feature vector sequences2007

Author(s)

Journal Title

[Journal Article] Details of Nitech HMM-based speech synthesis system for the Blizzard Challenge 20052007

Author(s)

Journal Title

全炳河名古屋工業大学, 工学研究科, 研究員 (60432291)