• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

多方言音声合成のための地理情報を利用した音韻・アクセントモデリングに関する研究

研究課題

研究課題/領域番号 18K18100
研究機関東京大学

研究代表者

高道 慎之介  東京大学, 大学院情報理工学系研究科, 助教 (90784330)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード音声合成 / 方言 / 韻律
研究実績の概要

音声のアクセントの教師なし推定のために,音響モデル尤度に基づくsubword分割法と,隠れマルコフモデルに基づく教師なし音声合成法を提案した.2018年度に提案した教師なし音声合成法は,方言の地理情報を利用することで多様な方言音声の合成を可能にした一方で,その言語単位が言語モデル的に分割されていたため,その品質に限界があった.音響モデル尤度に基づくsubword分割法は,音声合成の言語単位を音響モデル尤度(すなわち,音声特徴量の予測しやすさ)に基づいて決定する方法である.本研究では,深層生成モデルを出力分布として持つ隠れマルコフモデルを立て,その学習法・生成法を定式化し,音声合成の音質改善への貢献を確認した.
隠れマルコフモデルに基づく教師なし音声合成法では,2018年度までに提案した深層ニューラルネットワークに基づく方法を改良したものであり,より簡易でありつつも,従来技術と同程度の音質を達成した.
本年度は更に,ネイティブ方言(熊本弁)話者の高品質コーパスを収録した.2018年度までに構築した方言コーパス(CPJDコーパス)は,大規模だが低品質なものであった.CPJDコーパスに基づく音声合成の性能限界を来年度調査するために,そのリファレンスとして高品質コーパスを構築した.高品質コーパスの一部は,CPJDコーパスとの対訳となっているため,これらのコーパスを織り交ぜた研究発展も期待できる.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2018年度と2019年度を通して,予定通り,地理情報を利用した方言合成法とその高品質化に成功した.そのため,概ね順調に進展しているといえる.

今後の研究の推進方策

計画時には予定していなかった高品質コーパス収録も行ったため,来年度は,低品質・高品質コーパスを織り交ぜた研究を実施する.

次年度使用額が生じた理由

来年度には,音声コーパスを新たに収録するため,そのために利用する.

  • 研究成果

    (3件)

すべて 2020 2019

すべて 学会発表 (3件) (うち国際学会 1件)

  • [学会発表] 音響モデル尤度に基づく subword 分割の韻律推定精度における評価2020

    • 著者名/発表者名
      阿曽 真至,高道 慎之介,高宗 典玄,猿渡 洋
    • 学会等名
      日本音響学会2020年春季研究発表会講演論文集
  • [学会発表] Subword tokenization based on DNN-based acoustic model for end-to-end prosody generation2019

    • 著者名/発表者名
      Masashi Aso, Shinnosuke Takamichi, Norihiro Takamune, Hiroshi Saruwatari
    • 学会等名
      ISCA SSW
    • 国際学会
  • [学会発表] End-to-end 韻律推定に向けたDNN音響モデルに基づくsubword分割2019

    • 著者名/発表者名
      阿曽 真至,高道 慎之介,高宗 典玄,猿渡 洋
    • 学会等名
      日本音響学会2019年秋季研究発表会講演論文集

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi