• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

研究課題

研究課題/領域番号 15300055
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

キーワードテキスト音声合成 / 平均声 / 感情音声・発話様式(スタイル) / 話者適応 / スタイル適応 / スタイル制御 / HMM音声合成 / 隠れセミマルコフモデル
研究概要

本研究では「平均声からの音声合成」という新たな音声合成の枠組みを発展させ,任意の話者の多様な声質や発話様式など,各個人が持っている話し方の個性を自由に表現でき,気の利いた音声インタラクションが実現可能な音声合成システムを開発することを目的とし,研究の最終年度として,平均声モデルから目標とする任意の話者モデルへの適応手法の確立,平静スタイルモデルから任意の感情表現・発話様式(スタイル)モデルへの適応手法の確立,指定した任意スタイルの音声を生成するスタイル制御手法の確立,そして各話者の個性を表現可能な音声合成システム実現の検討を行った。
まず,平均声モデルから目標とする任意の話者モデルへの適応手法では,従来の最尤線形回帰(MLLR)に基づくモデル適応に加え,事後確率最大線形回帰(MAPLR),構造的MAPLR(SMAPLR),制約付MLLR(CMLLR)等のモデル適応手法に基づいて,隠れセミマルコフモデル(HSMM)を用いたモデル化のための適応アルゴリズムを導出し,合成音声の客観・主観評価を通して各手法の適応性能の比較検討を行った。そしてこの結果を基に,新たに制約付構造的MAPLR(CSMAPLR)適応アルゴリズムを提案し,その有効性を検討した。次に,任意のスタイルモデルへの適応手法では,音韻継続長を考慮したHSMMとスープラセグメンタル特徴に基づいたスタイル適応手法を導出し,スタイル適応合成音声の客観・主観評価を通して提案手法の有効性を示した。さらに,指定した任意のスタイルの音声を生成するためのスタイル制御手法として,重回帰HSMMに基づいた手法を提案し,その有効性を示した。そして,任意の声質・スタイルを直観的に制御可能な音声合成プロトタイプシステムを作成し,気の利いたインタラクションシステム実現の検討を行った。

  • 研究成果

    (20件)

すべて 2006 2005

すべて 雑誌論文 (20件)

  • [雑誌論文] 重回帰HSMMを用いた合成音声のスタイル制御2006

    • 著者名/発表者名
      能勢 隆
    • 雑誌名

      電子情報通信学会技術研究報告,SP2005-160 105・572

      ページ: 61-66

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 重回帰HSMMに基づく音声の発話様式・感情表現の推定2006

    • 著者名/発表者名
      能勢 隆
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 219-220

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 重回帰HSMMに基づく合成音声の声質制御の検討2006

    • 著者名/発表者名
      橘 誠
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 297-298

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] A style adaptation technique for speech synthesis using HSMM and suprasegmental features2006

    • 著者名/発表者名
      Makoto Tachibana
    • 雑誌名

      IEICE Trans.Information and Systems E89-D・3

      ページ: 1092-1099

  • [雑誌論文] HSMM音声合成における話者適応とMAPに基づく音響モデル学習法2006

    • 著者名/発表者名
      緒方克海
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 299-300

  • [雑誌論文] HMM音声合成のための話者正規化クラスタリングと話者正規化学習2006

    • 著者名/発表者名
      山岸順一
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 301-302

  • [雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの評価2006

    • 著者名/発表者名
      中野雄資
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 385-386

  • [雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価2005

    • 著者名/発表者名
      橘 誠
    • 雑誌名

      電子情報通信学会技術研究報告,SP2005-51 105・252

      ページ: 29-34

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 重回帰HSMMを用いた音声のスタイル制御法の検討2005

    • 著者名/発表者名
      能勢 隆
    • 雑誌名

      日本音響学会2005年秋季研究発表会講演論文集

      ページ: 287-288

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 多様な音声合成のためのスタイル適応アルゴリズムの比較検討2005

    • 著者名/発表者名
      橘 誠
    • 雑誌名

      日本音響学会2005年秋季研究発表会講演論文集

      ページ: 289-290

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Speech synthesis with various emotional expressions and speaking styles by style interpolation and morphing2005

    • 著者名/発表者名
      Makoto Tachibana
    • 雑誌名

      IEICE Trans.Information and Systems E88-D・11

      ページ: 2484-2491

    • 説明
      「研究成果報告書概要(欧文)」より
  • [雑誌論文] Adaptive training for hidden semi-Markov model2005

    • 著者名/発表者名
      Junichi Yamagishi
    • 雑誌名

      Proc.2005 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2005 1

      ページ: 365-368

  • [雑誌論文] Voiced/unvoiced determination of speech signal in noisy environment using harmonicity measure based on instantaneous frequency2005

    • 著者名/発表者名
      Dhany Arifianto
    • 雑誌名

      Proc.2005 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2005 1

      ページ: 877-880

  • [雑誌論文] Model adaptation and adaptive training using ESAT algorithm for HMM-based speech synthesis2005

    • 著者名/発表者名
      Juri Isogai
    • 雑誌名

      Proc.9th European Conference on Speech Communication and Technology, INTERSPEECH 2005

      ページ: 2597-2600

  • [雑誌論文] Performance evaluation of style adaptation for hidden semi-Markov model based speech synthesis2005

    • 著者名/発表者名
      Makoto Tachibana
    • 雑誌名

      Proc.9th European Conference on Speech Communication and Technology, INTERSPEECH 2005

      ページ: 2805-2808

  • [雑誌論文] 多様な音声合成のためめモデル適応・適応学習アルゴリズムの検討2005

    • 著者名/発表者名
      磯貝朱里
    • 雑誌名

      電子情報通信学会技術研究報告,SP2005-50 105・252

      ページ: 23-28

  • [雑誌論文] 多様な話者性および発話スタイル・感情表現による音声合成2005

    • 著者名/発表者名
      小林隆夫
    • 雑誌名

      日本音響学会2005年秋季研究発表会講演論文集

      ページ: 283-286

  • [雑誌論文] HMM音声合成におけるESATアルゴリズムの評価2005

    • 著者名/発表者名
      磯貝朱里
    • 雑誌名

      日本音響学会2005年秋季研究発表会講演論文集

      ページ: 373-374

  • [雑誌論文] 平均声に基づく音声合成のための話者適応アルゴリズムの検討2005

    • 著者名/発表者名
      中野雄資
    • 雑誌名

      日本音響学会2005年秋季研究発表会講演論文集

      ページ: 395-396

  • [雑誌論文] HSD-HMMを用いた音声のスタイル識別手法の評価2005

    • 著者名/発表者名
      川島啓吾
    • 雑誌名

      日本音響学会2006年春季研究発表会講演論文集

      ページ: 165-166

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi