• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 研究成果報告書

深層ガウス過程に基づく統計的音声合成

研究課題

  • PDF
研究課題/領域番号 19K20292
研究種目

若手研究

配分区分基金
審査区分 小区分61010:知覚情報処理関連
研究機関東京大学

研究代表者

郡山 知樹  東京大学, 大学院情報理工学系研究科, 講師 (50749124)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードガウス過程 / 深層学習 / 音声合成 / 潜在変数モデル / 時系列モデル
研究成果の概要

未知のデータに頑健なモデルとして提案されている深層ガウス過程(Deep Gaussian process, DGP)を,時系列のモデル化が必要な音声合成に応用する手法として,リカレント構造やself-attention構造,sequence-to-sequence構造を持つDGPを提案した.提案手法は同様の構造を持つDNN音声合成より高品質な音声を合成できる傾向があることを示した.本研究課題の成果によって,ニューラルネットワークに用いられる様々な構造がDGPでも実現可能であり,ベイズの特徴を用いた頑健な深層学習ができることを示した.

自由記述の分野

音声情報処理

研究成果の学術的意義や社会的意義

現在,多くの機械学習の研究はDNNを基盤要素としているが,DNNの学習におけるハイパーパラメータの調整は手間のかかるものであり,機械学習モデルの構築は職人作業のようになっている現状がある.代替となり得るモデルとしてガウス過程回帰に注目が集まっているが,自由度が低く様々なデータに適用できない問題があった.本研究の応用実験によってガウス過程回帰の深層モデルとしての自由度の向上を明らかにした.この成果によって,音声に限らず自由度の高い深層学習モデルの頑健な学習への道筋の一つを示した.

URL: 

公開日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi