• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

ベイズ基準によるHMMに基づく音声合成における動的なパラメータ共有構造選択

Research Project

Project/Area Number 10J10062
Research InstitutionNagoya Institute of Technology

Principal Investigator

橋本 佳  名古屋工業大学, 大学院・工学研究科, 特別研究員(DC2)

Keywords音声合成 / ベイズ基準 / パラメータ共有構造
Research Abstract

HMMに基づく音声合成において,パラメータ共有のための決定木構造の選択基準として様々な基準が提案されているが,これらの基準は一般に学習データに対する評価値が最も高くなる決定木構造を最適なパラメータ共有構造として選択する.このため,あらゆるテキストに対して平均的に高い品質の音声を合成することが可能となる.しかし,学習データに対する最適なパラメータ共有構造が合成するテキストにとって最適ではなく,生成するテキストごとに最適なパラメータ共有構造は異なると考えられる.そのため,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法を確立することを目指す.合成テキストごとに最適なパラメータ共有構造を選択するために,まず,パラメータ共有構造と合成音声の品質に関する分析,そして,合成テキストに対する最適な評価関数の検討を行った.そして,これらの結果をもとに,合成テキストごとにパラメータ共有構造の選択を行った.提案法は従来法から合成音声の品質を大きく改善したが,事前分布の設定が大きく影響を与えることがわかった.そのため,今後は適切な事前分布の設定法に関する検討が必要である.また,テキストごとにパラメータ共有構造を選択するため,従来よりも多大な計算コストを必要とする.実環境においてストレスなく音声合成システムが動作するような,パラメータ共有構造の高速選択も課題となる.

  • Research Products

    (6 results)

All 2011 2010

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results)

  • [Journal Article] Bayesian context clustering using cross validation for speech recognition2011

    • Author(s)
      Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda
    • Journal Title

      IEICE TRANSACTIONS on Information & Systems

      Volume: E94-D Pages: 668-678

    • Peer Reviewed
  • [Presentation] 音声翻訳における機械翻訳・音声合成の性能評価および分析2011

    • Author(s)
      橋本佳, 山岸順一, Wimam Byrne, Simon King, 徳田恵一
    • Organizer
      音響学会春季研究発表会
    • Place of Presentation
      東京・早稲田大
    • Year and Date
      2011-03-11
  • [Presentation] 複数のパラメータ共有構造を考慮したベイズ基準による音響モデリングの検討2011

    • Author(s)
      塩田さやか, 橋本佳, 南角吉彦, 徳田恵一
    • Organizer
      音響学会春季研究発表会
    • Place of Presentation
      東京・早稲田大
    • Year and Date
      2011-03-09
  • [Presentation] Overview of NIT HMM-based speech synthesis system for Blizzard Challenge 20102010

    • Author(s)
      Keiichiro Oura, Kei Hashimoto, Sayaka Shiota, Keiichi Tokuda
    • Organizer
      Blizzard Challenge 2010
    • Place of Presentation
      京都・ATR
    • Year and Date
      2010-09-25
  • [Presentation] Bayesian speech synthesis integrating training and synthesis processes2010

    • Author(s)
      Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • Organizer
      SSW7
    • Place of Presentation
      京都・ATR
    • Year and Date
      2010-09-23
  • [Presentation] 学習・合成過程が統合されだベイズ音声合成2010

    • Author(s)
      橋本佳, 南角吉彦, 徳田恵一
    • Organizer
      音響学会秋季研究発表会
    • Place of Presentation
      大阪・関西大
    • Year and Date
      2010-09-15

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi