• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

任意の話者性・感情表現・発話様式によるテキスト音声合成の実現

Research Project

Project/Area Number 04J04633
Research InstitutionTokyo Institute of Technology

Principal Investigator

山岸 順一  東京工業大学, 大学院・総合理工学研究科, 特別研究員(DC1)

Keywords音声合成 / 隠れマルコフモデル / 統計的音声合成 / 感情表現を伴う音声合成 / 多様な発話様式による音声合成 / ヒューマンインターフェース / 音声信号処理 / 統計的音声処理
Research Abstract

与えられた任意のテキストに対応する音声を生成する技術はテキスト音声合成と呼ばれ,自然性の高い合成音声が現在生成可能となりつつある.しかし合成音声の話者の声質や感情表現は非常に限定されたものであり.多様さに欠けたものが多い.この問題に対し,本研究では,合成音声の声質や合成音声の感情表現や発話様式を自由に変更することが可能な、「モデル適応手法を用いた音声合成方式〜平均声に基づく音声合成方式〜」という新たな枠組みによる音声合成方式を実現することを目標に数学的な理論およびその理論に基づく実システムの構築について検討している.本年度は主に多様な感情表現や発話様式を伴う音声を合成することを実現するための研究、および、新たな合成音声の感情表現や発話様式をごく少量のサンプルデータをもとに通常の発話スタイルの音声から変換することで容易に実現するための研究、およびその変換に用いられるモデル適応手法の数学的な問題点について解決し、本システムにより適したモデル適応アルゴリズムを実現することで合成音声の品質をさらに向上させることについて重点的に研究を行った。具体的には、隠れマルコフモデル(HMM)を用いて音声の声質・韻律の特徴量を音声データからモデル化することでHMMの学習に用いた音声の感情表現と発話様式とほぼ同様なスタイルを擁する合成音声を生成可能であることを示した。また最尤線形回帰というモデル適応アルゴリズムを用いることで数分程度のごく少量の目標スタイルのサンプル音声をもとに通常の読み上げスタイルの合成音声を目標のスタイルに変換可能であることも示した。これにより新たな感情表現や発話様式を非常に容易に実現することが可能になると考えられる。また従来の最尤線形回帰アルゴリズムは合成音声のテンポやリズムに相当する音韻継続長を変換することが理論的に不可能であったが、隠れセミマルコフモデル(HSMM)に基づいて最尤線形回帰アルゴリズムを導出することで、合成音声の声質や声の高さのみならずテンポやリズムも変換可能なモデル適応アルゴリズムを実現し、その有効性を示した。

  • Research Products

    (11 results)

All 2005 2004

All Journal Article (11 results)

  • [Journal Article] Acoustic Modeling of Speaking Styles and Emotional Expressions in HMM-based Speech Synthesis2005

    • Author(s)
      山岸 順一
    • Journal Title

      IEICE Trans. Information and Systems Vol.E88-D, No.3

      Pages: 502-509

  • [Journal Article] Adaptive training for hidden semi-Markov model2005

    • Author(s)
      山岸 順一
    • Journal Title

      Proc. the 2005 IEEE International Conference on Acoustics, Speech and Signal Processing (発表予定)

  • [Journal Article] 隠れセミマルコフモデルに基づく適応学習アルゴリズム2005

    • Author(s)
      山岸 順一
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 (発表予定)

  • [Journal Article] モデル補間による発話スタイル・感情表現の制御の検討2005

    • Author(s)
      橘 誠
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 (発表予定)

  • [Journal Article] HMM音声合成におけるESATアルゴリズムを用いたモデル適応および適応学習の検討2005

    • Author(s)
      磯貝 朱里
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 (発表予定)

  • [Journal Article] HMM音声合成における決定木の分割停止基準の検討2005

    • Author(s)
      野村 大輔
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 (発表予定)

  • [Journal Article] MLLR adaptation for hidden semi-Markov model based speech synthesis2004

    • Author(s)
      山岸 順一
    • Journal Title

      Proc. the 8th International Conference on Spoken Language 2004

      Pages: WeC14010.5

  • [Journal Article] Speaking style adaptation using context clustering decision tree for HMM-based speech synthesis2004

    • Author(s)
      山岸 順一
    • Journal Title

      Proc. the 2004 IEEE International Conference on Acoustics, Speech and Signal Processing Vol.I

      Pages: 5-8

  • [Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰よるスタイル適応の検討2004

    • Author(s)
      山岸 順二
    • Journal Title

      電子情報通信学会技術研究報告 vol.104

      Pages: 13-18

  • [Journal Article] 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討2004

    • Author(s)
      山岸 順一
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 I

      Pages: 331-332

  • [Journal Article] 隠れセミマルコフモデルに基づく音声合成におけるスタイル適応の評価2004

    • Author(s)
      橘 誠
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 I

      Pages: 333-334

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi