2021 Fiscal Year Annual Research Report

Pronunciation and accent modeling for multi-dialect speech synthesis

Research Project

Project/Area Number	18K18100
Research Institution	The University of Tokyo
Principal Investigator	高道慎之介東京大学, 大学院情報理工学系研究科, 助教 (90784330)
Project Period (FY)	2018-04-01 – 2022-03-31
Keywords	音声合成 / 方言 / 韻律
Outline of Annual Research Achievements	昨年度までに，教師なし推定の別の方法として，変分オートエンコーダを利用した潜在変数獲得を試みた．日本語アクセントに関する離散的な潜在変数を教師なしに獲得する方法を提案し，日本語と同様に4段階の離散表現が，最も効率的であることを明らかにした．本年度は，この潜在変数を用いた音声合成法を試みた．encoder-decoder 型でアクセント情報を付与する方式と，東京方言アクセント辞書を用いる方法を提案し，それぞれ有効性を確認した．本内容を，日本音響学会および speech synthesis workshop 12 で発表した．また，本年度は，これまでに作成した方言音声合成コーパスを，代表者ウェブサイト上で一般公開した．この公開により，アカデミック研究者に限らず，誰でも方言音声合成に試みることが可能になった．

[Presentation] Accent Modeling of Low-Resourced Dialect in Pitch Accent Language Using Variational Autoencoder2021
- Author(s)
  Kazuya Yufune, Tomoki Koriyama, Shinnosuke Takamichi and Hiroshi Saruwatari
- Organizer
  The 11th ISCA SSW
- Int'l Joint Research
[Presentation] VQ-VAE に基づくアクセントの潜在変数表現を用いた方言音声合成2021
- Author(s)
  湯舟航耶，郡山知樹，高道慎之介，猿渡洋
- Organizer
  日本音響学会2021年秋季研究発表会講演論文集
[Presentation] アクセント潜在変数を用いた方言音声合成における文単位生成の評価2021
- Author(s)
  湯舟航耶，郡山知樹，高道慎之介，猿渡洋
- Organizer
  電子情報通信学会技術研究報告