統計的音声認識・合成のための次世代音響モデリング

研究課題

研究課題/領域番号	18800019
研究種目	若手研究(スタートアップ)
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	名古屋工業大学
研究代表者	全炳河名古屋工業大学, 工学研究科, 研究員 (60432291)
研究期間 (年度)	2006 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	2,400千円 (直接経費: 2,400千円) 2007年度: 1,200千円 (直接経費: 1,200千円) 2006年度: 1,200千円 (直接経費: 1,200千円)
キーワード	音声認識 / 音声合成 / 音響モデル / 隠れマルコフモデル / トラジェクトリモデル / ベイズ学習 / 話者適応 / セミマルコフモデル
研究概要	統計的音声認識や音声合成における音響モデルとして広く用いられている隠れマルコフモデル(HMM)の本質的限界としては,以下の3点がある。(1)状態内で統計量が一定であり,状態内での時間変化をモデル化できない。(2)観測ベクトル間の時間的独立性を仮定しており,時間的な依存関係を表現できない。(3)状態持続時間長確率分布が幾何分布であり,実際の音声の持続時間特性をモデル化できない。これらの問題は,HMMにおける仮定である,状態内での統計的定常性、観測ベクトル間の条件付無相関性、1次のマルコフ過程,に関するものである。HMMの取り扱いの容易さと実装可能性は,これらの仮定によっているものの,実際の音声ラメータ列では成り立たないものである。そこで,本年は,一つ目及びニつ目の問題を同時に解決可能な新しい統計モデリング手法であるトラジェクトリHMMを導入し,これを用いて音声認識、合成を行うための各種アルゴリズムを整備した。具体的には,モンテカルロEMに基づく学習アルゴリズム及び特徴量空間、モデル空間における線形変換を用いた話者適応アルゴリズムを導出した。また,これらのアルゴリズムを実際に音声認識に適用、評価し,国際会議等で発表した。三つ目の問題を解決できる隠れセミマルコフモデル学習のための各種ツールの整備を行い,最新の音声合成システムに組み込み,音声合成システムの国際的な評価会に参加し,優秀な成績を収めた。

報告書

(2件)

2007 実績報告書
2006 実績報告書

研究成果
(6件)

すべて 2007

すべて雑誌論文 (3件) (うち査読あり 1件) 学会発表 (3件)

[雑誌論文] A hidden semi-Markov model-based speech synthesis system2007
- 著者名/発表者名
  Heiga Zen
- 雑誌名
  
  IEICE TRANSACTIONS on Information and Svstems E90-D No. 5
  
  ページ: 825-834
- 関連する報告書
  2007 実績報告書
- 査読あり
[雑誌論文] Reformulating the HMM as a trajectory model by imposing explicit relationships between static and dynamic feature vector sequences2007
- 著者名/発表者名
  Heiga Zen
- 雑誌名
  
  Computer Speech and Language Vol.21 No.1
  
  ページ: 153-173
- 関連する報告書
  2006 実績報告書
[雑誌論文] Details of Nitech HMM-based speech synthesis system for the Blizzard Challenge 20052007
- 著者名/発表者名
  Heiga Zen
- 雑誌名
  
  IEICE TRANSACTIONS on Information and Systems Vol.E90-D No.1
  
  ページ: 325-333
- 関連する報告書
  2006 実績報告書
[学会発表] モデル空間最尤線形回帰に基つくトラジェクトリHMMの話者適応2007
- 著者名/発表者名
  全〓河
- 学会等名
  日本音響学会
- 発表場所
  山梨大学
- 関連する報告書
  2007 実績報告書
[学会発表] Model-space MLLR for tralectory HMMs2007
- 著者名/発表者名
  Heiga Zen
- 学会等名
  Interspeech2008
- 発表場所
  アントワープ
- 関連する報告書
  2007 実績報告書
[学会発表] The HMM-based speech synthesis system version 2.02007
- 著者名/発表者名
  Heiga Zen
- 学会等名
  ISCA Speech Synthesis Workshop
- 発表場所
  ボン
- 関連する報告書
  2007 実績報告書

統計的音声認識・合成のための次世代音響モデリング

研究代表者

全 炳河 名古屋工業大学, 工学研究科, 研究員 (60432291)

2,400千円 (直接経費: 2,400千円)

報告書

研究成果

[雑誌論文] A hidden semi-Markov model-based speech synthesis system2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Reformulating the HMM as a trajectory model by imposing explicit relationships between static and dynamic feature vector sequences2007

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Details of Nitech HMM-based speech synthesis system for the Blizzard Challenge 20052007

著者名/発表者名

雑誌名

関連する報告書

[学会発表] モデル空間最尤線形回帰に基つくトラジェクトリHMMの話者適応2007

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] Model-space MLLR for tralectory HMMs2007

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] The HMM-based speech synthesis system version 2.02007

著者名/発表者名

学会等名

発表場所

関連する報告書

全炳河名古屋工業大学, 工学研究科, 研究員 (60432291)