研究課題/領域番号 |
15H02724
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 東京工業大学 |
研究代表者 |
小林 隆夫 東京工業大学, 工学院, 教授 (70153616)
|
研究分担者 |
郡山 知樹 東京工業大学, 工学院, 助教 (50749124)
|
研究協力者 |
Moungsri Decha
長濱 大樹
能勢 隆
Arifianto Dhany
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
2017年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2016年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2015年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
|
キーワード | テキスト音声合成 / 統計的パラメトリック音声合成 / 韻律生成 / ガウス過程回帰 / GPR音声合成 / HMM音声合成 / 機械学習 / 深層学習 / 音声情報処理 / 深層ガウス過程 |
研究成果の概要 |
多様で表情豊かな音声合成の実現に向け,統計的パラメトリック音声合成の新たな枠組みであるガウス過程回帰に基づく音声合成(GPR音声合成)技術の確立をめざして研究を行った。ガウス過程回帰に基づいたスペクトルパラメータ生成に加え,基本周波数および音韻継続長予測からなる韻律生成手法を提案し,GPR音声合成システムを構築した。評価実験を通してGPR音声合成手法の有効性を示すとともに,多様な話者性やスタイルによる音声合成への応用,従来手法では合成音声の韻律の自然性が不十分であった声調言語への適用を検討し,提案手法の有用性を示した。
|