2020 Fiscal Year Research-status Report
多方言音声合成のための地理情報を利用した音韻・アクセントモデリングに関する研究
Project/Area Number |
18K18100
|
Research Institution | The University of Tokyo |
Principal Investigator |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 音声合成 / 方言 / 韻律 |
Outline of Annual Research Achievements |
昨年度に,音声のアクセントの教師なし推定のために,音響モデル尤度に基づくsubword分割法と,隠れマルコフモデルに基づく教師なし音声合成法を提案した.本年度は,その追加実験を実施した.その結果,音声合成を一気通貫で学習するEnd-to-end よりも高品質であるが,言語知識を利用する教師あり推定には及ばない結果を得た.本結果は,国際論文誌 Elsevier Speech Communication に採択され,更に,当該論文誌の注目論文に与えられる most popular article に選出された.
本年度は,教師なし推定の別の方法として,変分オートエンコーダを利用した潜在変数獲得を試みた.日本語アクセントに関する離散的な潜在変数を教師なしに獲得する方法を提案し,日本語と同様に4段階の離散表現が,最も効率的であることを明らかにした.
更に,上記の研究の実施にあたり,音声合成用の大阪弁コーパス1300文を作成した.本コーパスは,昨年度作成した熊本弁1300文と同様に今後,公開する予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
潜在変数獲得に進行がやや遅れている.来年度に実施する予定である.
|
Strategy for Future Research Activity |
前年度における実施が遅れた潜在変数獲得について,実施する.
|
Causes of Carryover |
研究成果の発表時期が遅れ,次年度に発表を行うため.
|
Research Products
(2 results)