2017 年度研究成果報告書

ガウス過程回帰に基づく音声合成技術の確立

研究課題

研究課題/領域番号	15H02724
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知覚情報処理
研究機関	東京工業大学
研究代表者	小林隆夫東京工業大学, 工学院, 教授 (70153616)
研究分担者	郡山知樹東京工業大学, 工学院, 助教 (50749124)
研究協力者	Moungsri Decha 長濱大樹能勢隆 Arifianto Dhany
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	テキスト音声合成 / 統計的パラメトリック音声合成 / 韻律生成 / ガウス過程回帰 / GPR音声合成 / HMM音声合成 / 機械学習 / 深層学習
研究成果の概要	多様で表情豊かな音声合成の実現に向け，統計的パラメトリック音声合成の新たな枠組みであるガウス過程回帰に基づく音声合成（GPR音声合成）技術の確立をめざして研究を行った。ガウス過程回帰に基づいたスペクトルパラメータ生成に加え，基本周波数および音韻継続長予測からなる韻律生成手法を提案し，GPR音声合成システムを構築した。評価実験を通してGPR音声合成手法の有効性を示すとともに，多様な話者性やスタイルによる音声合成への応用，従来手法では合成音声の韻律の自然性が不十分であった声調言語への適用を検討し，提案手法の有用性を示した。
自由記述の分野	音声情報処理