研究課題/領域番号 |
18K18100
|
研究機関 | 東京大学 |
研究代表者 |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 音声合成 / 方言 / 韻律 |
研究実績の概要 |
昨年度に,音声のアクセントの教師なし推定のために,音響モデル尤度に基づくsubword分割法と,隠れマルコフモデルに基づく教師なし音声合成法を提案した.本年度は,その追加実験を実施した.その結果,音声合成を一気通貫で学習するEnd-to-end よりも高品質であるが,言語知識を利用する教師あり推定には及ばない結果を得た.本結果は,国際論文誌 Elsevier Speech Communication に採択され,更に,当該論文誌の注目論文に与えられる most popular article に選出された.
本年度は,教師なし推定の別の方法として,変分オートエンコーダを利用した潜在変数獲得を試みた.日本語アクセントに関する離散的な潜在変数を教師なしに獲得する方法を提案し,日本語と同様に4段階の離散表現が,最も効率的であることを明らかにした.
更に,上記の研究の実施にあたり,音声合成用の大阪弁コーパス1300文を作成した.本コーパスは,昨年度作成した熊本弁1300文と同様に今後,公開する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
潜在変数獲得に進行がやや遅れている.来年度に実施する予定である.
|
今後の研究の推進方策 |
前年度における実施が遅れた潜在変数獲得について,実施する.
|
次年度使用額が生じた理由 |
研究成果の発表時期が遅れ,次年度に発表を行うため.
|