• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

Continual Learning に基づく持続的に学習可能な音声合成

研究課題

研究課題/領域番号 21K21305
研究機関東京大学

研究代表者

齋藤 佑樹  東京大学, 大学院情報理工学系研究科, 特任助教 (20907901)

研究期間 (年度) 2021-08-30 – 2023-03-31
キーワード音声合成 / 深層学習 / Continual Learning
研究実績の概要

(1) 単一話者の多ドメイン音声合成のためのContinual Learningの検討:近年広く用いられている音声合成モデルであるFastSpeech2ベースの音声合成において,単一話者の多様なドメインのテキスト読み上げ音声が逐次的に与えられるContinual Learningを想定した実験を実施した.結果から,(1)破滅的忘却の影響は,合成音声の韻律・スペクトル包絡特徴量の予測において特に顕著であること,(2)リハーサル法が破滅的忘却に起因する合成音声の品質劣化を緩和させることを示した.本研究成果は,日本音響学会 2021年秋季研究発表会で公表した.

(2) (1)の内容を多話者音声合成に拡張するための予備検討として,学習データに含まれる既知話者の音声特徴量の分布と,学習データに含まれない(既知話者の特徴を補間して得られる)未知話者の音声特徴量の分布を近づけるような制約を考慮した敵対的学習により,未知話者の高品質な音声を合成できる技術を提案した.実験的評価の結果から,提案技術が合成音声の話者類似性と,話者モーフィングの操作性を改善する傾向にあることを示した.本研究成果は,電子情報通信学会 2022年3月音声研究会で公表した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

概ね計画書通りに進行している.

今後の研究の推進方策

今後は,本研究で提案した技術を多話者音声合成に拡張する予定である.

次年度使用額が生じた理由

今年度中に予定していた国際会議発表を次年度に変更したため,使用額に変更が生じた.差額は,次年度中に旅費に利用する予定である.

  • 研究成果

    (2件)

すべて 2022 2021

すべて 学会発表 (2件)

  • [学会発表] 多話者音声合成のためのAdversarial Regularizerを考慮した学習アルゴリズム2022

    • 著者名/発表者名
      仲井 佑友輔,宇田川 健太,齋藤 佑樹,猿渡 洋
    • 学会等名
      電子情報通信学会 2022年3月音声研究会
  • [学会発表] End-to-End音声合成のContinual Learningにおける破滅的忘却の影響の調査2021

    • 著者名/発表者名
      齋藤 佑樹,猿渡 洋
    • 学会等名
      日本音響学会 2021年秋季研究発表会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi