• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

平均声に基づく多様な声質・発話スタイルが可能な音声合成の実現

研究課題

研究課題/領域番号 15300055
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 大学院・総合理工学研究科, 教授 (70153616)

研究分担者 益子 貴史  株式会社東芝, 研究開発センターマルチメディアラボラトリー, 研究主務(研究職) (90272715)
住田 一男  株式会社東芝, 研究開発センター知識メディアラボラトリー, 室長(研究職)
キーワードテキスト音声合成 / 平均声 / 感情音声・発話スタイル / スタイル適応 / スタイル補間 / スタイル制御 / HMM音声合成 / 隠れセミマルコフモデル(HSMM)
研究概要

本研究では「平均声からの音声合成」という新たな音声合成の枠組みを発展させ,任意の話者の多様な声質や発話様式など,各個人が持っている話し方の個性を自由に表現でき,気の利いた音声インタラクションが実現可能な音声合成システムを開発することを目的とし,研究の第2年度として,平均声のモデル化・適応手法の精密化,および多様な発話スタイル・感情を含む音声のモデル化と適応手法の検討を行うとともに,初年度に引続き研究基盤の整備を行った。
まず,平均声のモデル化手法とモデル適応手法の精密化では,これまで近似的に実装されてきた音韻継続長のモデル化と適応手法について,隠れマルコフモデルに状態継続長分布を明示的に導入した隠れセミマルコフモデルを用いる定式化とこれに基づくモデル適応アルゴリズムを提案した。主観評価実験を通して,従来法に比べてより精密なモデル化と自然性の高い音声の合成が可能であることを示した。適応手法についても拡張話者適応学習に基づく新たな手法の検討を行った。一方,発話スタイル・感情を含む音声に対しては,各スタイルの強調度合を直接的に指定可能なスタイル制御手法を提案し,評価実験を通して有効性を示した。また,スタイル補間手法についても,より詳細な評価実験を行った。さらに,「安心/不安」,「親しげ/嫌悪」,「速く/ゆっくり」というスタイルについても,モデル化を検討した。この他にも,モデル構築における決定木の停止基準に関する検討,研究実施の基盤となる音声データベースの整備を行った。

  • 研究成果

    (17件)

すべて 2005 2004

すべて 雑誌論文 (17件)

  • [雑誌論文] Acoustic modeling of speaking styles and emotional expressions in HMM-based speech synthesis2005

    • 著者名/発表者名
      Junichi Yamagishi
    • 雑誌名

      IEICE Trans. Information and Systems E88-D・3

      ページ: 502-509

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005

    • 著者名/発表者名
      山岸順一
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I・1-1-17

      ページ: 187-188

  • [雑誌論文] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005

    • 著者名/発表者名
      磯貝朱里
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I・1-1-18

      ページ: 189-190

  • [雑誌論文] モデル補間による発話スタイル・感情表現の制御の検討2005

    • 著者名/発表者名
      橘 誠
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I・1-1-19

      ページ: 191-192

  • [雑誌論文] HMM音声合成における決定木の分割停止基準の検討2005

    • 著者名/発表者名
      野村大輔
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I・3-P-26

      ページ: 291-292

  • [雑誌論文] Robust F0 estimation of speech signal using harmonicity measure based on instantaneous frequency2004

    • 著者名/発表者名
      Dhany Arifianto
    • 雑誌名

      IEICE Trans. Information and Systems E87-D・12

      ページ: 2812-2820

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004

    • 著者名/発表者名
      Junichi Yamagishi
    • 雑誌名

      Proc. the 2004 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2004 I

      ページ: 5-8

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] コーパスベース音声合成技術の動向[IV]-HMM音声合成方式-2004

    • 著者名/発表者名
      小林隆夫
    • 雑誌名

      電子情報通信学会誌 87・4

      ページ: 322-327

  • [雑誌論文] MLLR adaptation for hidden semi-Markov model based speech synthesis2004

    • 著者名/発表者名
      Junichi Yamagishi
    • 雑誌名

      Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・WeC1401o.5

  • [雑誌論文] Hidden semi-Markov model based speech synthesis2004

    • 著者名/発表者名
      Heiga Zen
    • 雑誌名

      Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・WeC1401o.5

  • [雑誌論文] A style control technique for HMM-based speech synthesis2004

    • 著者名/発表者名
      Keisuke Miyanaga
    • 雑誌名

      Proc. the 8th International Conference on Spoken Language Processing, INTERSPEECH 2004-ICSLP CD-ROM・Spec4701o.4

  • [雑誌論文] HMM-based speech synthesis with various speaking styles using model interpolation2004

    • 著者名/発表者名
      Makoto Tachibana
    • 雑誌名

      Proc. the 2nd International Conference on Speech Prosody, SP2004

      ページ: 413-416

  • [雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討2004

    • 著者名/発表者名
      山岸順一
    • 雑誌名

      電子情報通信学会技術研究報告 104・252

      ページ: 13-18

  • [雑誌論文] HMM音声合成における多様なスタイル実現のための制御法2004

    • 著者名/発表者名
      宮永圭介
    • 雑誌名

      電子情報通信学会技術研究報告 104・30

      ページ: 35-40

  • [雑誌論文] 多空間確率分布に基づくポーズのモデル化2004

    • 著者名/発表者名
      尾関 創
    • 雑誌名

      電子情報通信学会技術研究報告 104・30

      ページ: 5-8

  • [雑誌論文] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004

    • 著者名/発表者名
      山岸順一
    • 雑誌名

      日本音響学会2004年秋季研究発表会講演論文集 I・3-2-8

      ページ: 331-332

  • [雑誌論文] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004

    • 著者名/発表者名
      橘 誠
    • 雑誌名

      日本音響学会2004年秋季研究発表会講演論文集 I・3-2-9

      ページ: 333-334

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi