2021 Fiscal Year Annual Research Report
Pronunciation and accent modeling for multi-dialect speech synthesis
Project/Area Number |
18K18100
|
Research Institution | The University of Tokyo |
Principal Investigator |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 音声合成 / 方言 / 韻律 |
Outline of Annual Research Achievements |
昨年度までに,教師なし推定の別の方法として,変分オートエンコーダを利用した潜在変数獲得を試みた.日本語アクセントに関する離散的な潜在変数を教師なしに獲得する方法を提案し,日本語と同様に4段階の離散表現が,最も効率的であることを明らかにした.
本年度は,この潜在変数を用いた音声合成法を試みた.encoder-decoder 型でアクセント情報を付与する方式と,東京方言アクセント辞書を用いる方法を提案し,それぞれ有効性を確認した.本内容を,日本音響学会および speech synthesis workshop 12 で発表した.
また,本年度は,これまでに作成した方言音声合成コーパスを,代表者ウェブサイト上で一般公開した.この公開により,アカデミック研究者に限らず,誰でも方言音声合成に試みることが可能になった.
|
Research Products
(3 results)