• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ベイズ基準によるHMMに基づく音声合成における動的なパラメータ共有構造選択

研究課題

研究課題/領域番号 10J10062
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
研究分野 知覚情報処理・知能ロボティクス
研究機関名古屋工業大学

研究代表者

橋本 佳  名古屋工業大学, 大学院・工学研究科, 特別研究員(PD)

研究期間 (年度) 2010 – 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
1,400千円 (直接経費: 1,400千円)
2011年度: 700千円 (直接経費: 700千円)
2010年度: 700千円 (直接経費: 700千円)
キーワード音声合成 / ベイズ基準 / パラメータ共有構造 / 事前分布
研究概要

HMMに基づく音声合成において,パラメータ共有のための決定木構造の選択基準として様々な基準が提案されているが,これらの基準は一般に学習データに対する評価値が最も高くなる決定木構造を最適なパラメータ共有構造として選択する.このため,あらゆるテキストに対して平均的に高い品質の音声を合成することが可能となる.しかし,学習データに対する最適なパラメータ共有構造が合成するテキストにとって最適ではなく,生成するテキストごとに最適なパラメータ共有構造は異なると考えられる.そのため,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法を確立することを目指す.これまでの成果から,事前分布がパラメータ共有構造の選択に大きく影響を与えることが示されたため,適切な事前分布選択方法について検討を行った.複数の話者の学習データを用いることにより,他の話者の学習データを有効に利用することが可能になり,話者に非依存な音声の平均的な特徴を捉えた事前分布を推定することが可能になった.この事前分布を用いることによって,より適切なモデル構造を選択することが可能になり,合成音声の品質を大きく改善することを実験結果から示した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究の主目的である,合成テキストに対して最適なパラメータ共有構造をテキストごとに動的に選択し,高品質な音声合成手法の有効性を示し,さらに適切な事前分布の推定方法を提案したことによって,さらなる合成音声の品質改善を実現した.

今後の研究の推進方策

テキストごとに適切なパラメータ共有構造を選択することにより,合成音声の品質を大きく改善することを示したが,本手法は従来よりも多大な計算コストを必要となる.実環境においてストレスなく合成音声を生成するためにはパラメータ共有構造選択の高速化が必要であり,合成音声の品質を劣化させずに高速にパラメータ共有構造を選択するようなアルゴリズム,近似手法について今後検討していく必要がある.パラメータ共有構造の構築において,パラメータ共有構造全体をテキストごとに構築していくのではなく,テキストに非依存な構造をあらかじめ構築しておき,テキストに強く依存する部分の構造のみをテキストごとに構築することなどが近似手法として考えられる.

報告書

(2件)
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (17件)

すべて 2012 2011 2010

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (15件)

  • [雑誌論文] Speech recognition based on statistical models including multiple phonetic decision trees2011

    • 著者名/発表者名
      Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • 雑誌名

      Acoustical Science and Technology

      巻: 32 号: 6 ページ: 236-243

    • DOI

      10.1250/ast.32.236

    • NAID

      130001258012

    • ISSN
      0369-4232, 1346-3969, 1347-5177
    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Bayesian context clustering using cross validation for speech recognition2011

    • 著者名/発表者名
      Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda
    • 雑誌名

      IEICE TRANSACTIONS on Information & Systems

      巻: E94-D ページ: 668-678

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [学会発表] Face recognition based on separable lattice 2-D HMMs using variational Bayesian method2012

    • 著者名/発表者名
      Kei Sawada, Akira Tamamori, Kei Hashimoto. Yoshihiko Nankaku, Keiichi Tokuda
    • 学会等名
      ICASSP 2012
    • 発表場所
      京都
    • 年月日
      2012-03-30
    • 関連する報告書
      2011 実績報告書
  • [学会発表] A model structure integration based on Bayesian framework for speech recognition2012

    • 著者名/発表者名
      Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • 学会等名
      ICASSP 2012
    • 発表場所
      京都
    • 年月日
      2012-03-30
    • 関連する報告書
      2011 実績報告書
  • [学会発表] HMM音声合成における変分ベイズ法に基づく線形回帰2012

    • 著者名/発表者名
      橋本佳, 山岸順一, Peter Bell, Simon King, Steve Renals, 徳田恵一
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      横浜
    • 年月日
      2012-03-15
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 変分ベイズ法を用いた分離型2次元格子HMMの学習におけるアニーリング制御の適用2012

    • 著者名/発表者名
      沢田慶, 玉森聡, 橋本佳, 南角吉彦, 徳田恵一
    • 学会等名
      情報処理学会全国大会
    • 発表場所
      名古屋
    • 年月日
      2012-03-08
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 変分ベイズ法を用いた分離型2次元格子HMMに基づく顔画像認識2011

    • 著者名/発表者名
      沢田慶, 玉森聡, 橋本佳, 南角吉彦, 徳田恵一
    • 学会等名
      パターン認識・メディア理解研究会
    • 発表場所
      長崎
    • 年月日
      2011-11-25
    • 関連する報告書
      2011 実績報告書
  • [学会発表] ベイズ音声合成における事前分布とモデル構造の話者間共有2011

    • 著者名/発表者名
      橋本佳, 南角吉彦, 徳田恵一
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      島根
    • 年月日
      2011-09-22
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Overview of NIT HMM-based speech synthesis system for Blizzard Challenge 20112011

    • 著者名/発表者名
      Kei Hashimoto, Shinji Takaki, Keiichiro Oura, Keiichi Tokuda
    • 学会等名
      Blizzard Challenge 2011
    • 発表場所
      Turin, Italy
    • 年月日
      2011-09-02
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Multi-speaker modeling with shared prior distributions and model structures for Bayesian speech synthesis2011

    • 著者名/発表者名
      Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • 学会等名
      Interspeech 2011
    • 発表場所
      Florence, Italy
    • 年月日
      2011-08-28
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Bayesian speech recognition based on model structure integration2011

    • 著者名/発表者名
      Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • 学会等名
      音声研究会
    • 発表場所
      名古屋
    • 年月日
      2011-06-23
    • 関連する報告書
      2011 実績報告書
  • [学会発表] An analysis of machine translation and speech synthesis in speech-to-speech translation system2011

    • 著者名/発表者名
      Kei Hashimoto, Junichi Yamagishi, William Byrne, Simon King, Keiichi Tokuda
    • 学会等名
      ICASSP 2011
    • 発表場所
      Prague, Czech Republic
    • 年月日
      2011-05-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 音声翻訳における機械翻訳・音声合成の性能評価および分析2011

    • 著者名/発表者名
      橋本佳, 山岸順一, Wimam Byrne, Simon King, 徳田恵一
    • 学会等名
      音響学会春季研究発表会
    • 発表場所
      東京・早稲田大
    • 年月日
      2011-03-11
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 複数のパラメータ共有構造を考慮したベイズ基準による音響モデリングの検討2011

    • 著者名/発表者名
      塩田さやか, 橋本佳, 南角吉彦, 徳田恵一
    • 学会等名
      音響学会春季研究発表会
    • 発表場所
      東京・早稲田大
    • 年月日
      2011-03-09
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Overview of NIT HMM-based speech synthesis system for Blizzard Challenge 20102010

    • 著者名/発表者名
      Keiichiro Oura, Kei Hashimoto, Sayaka Shiota, Keiichi Tokuda
    • 学会等名
      Blizzard Challenge 2010
    • 発表場所
      京都・ATR
    • 年月日
      2010-09-25
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Bayesian speech synthesis integrating training and synthesis processes2010

    • 著者名/発表者名
      Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • 学会等名
      SSW7
    • 発表場所
      京都・ATR
    • 年月日
      2010-09-23
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 学習・合成過程が統合されだベイズ音声合成2010

    • 著者名/発表者名
      橋本佳, 南角吉彦, 徳田恵一
    • 学会等名
      音響学会秋季研究発表会
    • 発表場所
      大阪・関西大
    • 年月日
      2010-09-15
    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2010-12-03   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi