研究課題/領域番号 |
18K18100
|
研究機関 | 東京大学 |
研究代表者 |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 音声合成 / 方言 / 韻律 |
研究実績の概要 |
音声のアクセントの教師なし推定のために,音響モデル尤度に基づくsubword分割法と,隠れマルコフモデルに基づく教師なし音声合成法を提案した.2018年度に提案した教師なし音声合成法は,方言の地理情報を利用することで多様な方言音声の合成を可能にした一方で,その言語単位が言語モデル的に分割されていたため,その品質に限界があった.音響モデル尤度に基づくsubword分割法は,音声合成の言語単位を音響モデル尤度(すなわち,音声特徴量の予測しやすさ)に基づいて決定する方法である.本研究では,深層生成モデルを出力分布として持つ隠れマルコフモデルを立て,その学習法・生成法を定式化し,音声合成の音質改善への貢献を確認した. 隠れマルコフモデルに基づく教師なし音声合成法では,2018年度までに提案した深層ニューラルネットワークに基づく方法を改良したものであり,より簡易でありつつも,従来技術と同程度の音質を達成した. 本年度は更に,ネイティブ方言(熊本弁)話者の高品質コーパスを収録した.2018年度までに構築した方言コーパス(CPJDコーパス)は,大規模だが低品質なものであった.CPJDコーパスに基づく音声合成の性能限界を来年度調査するために,そのリファレンスとして高品質コーパスを構築した.高品質コーパスの一部は,CPJDコーパスとの対訳となっているため,これらのコーパスを織り交ぜた研究発展も期待できる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2018年度と2019年度を通して,予定通り,地理情報を利用した方言合成法とその高品質化に成功した.そのため,概ね順調に進展しているといえる.
|
今後の研究の推進方策 |
計画時には予定していなかった高品質コーパス収録も行ったため,来年度は,低品質・高品質コーパスを織り交ぜた研究を実施する.
|
次年度使用額が生じた理由 |
来年度には,音声コーパスを新たに収録するため,そのために利用する.
|