研究課題/領域番号 |
25540065
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知覚情報処理
|
研究機関 | 東京工業大学 |
研究代表者 |
小林 隆夫 東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)
|
研究分担者 |
能勢 隆 東北大学, 大学院工学研究科, 講師 (90550591)
|
研究協力者 |
郡山 知樹 東京工業大学, 大学院総合理工学研究科, 助教 (50749124)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2014年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2013年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | テキスト音声合成 / 統計的パラメトリック音声合成 / HMM音声合成 / ガウス過程回帰 / カーネル関数 / フレームコンテキスト / 統計的音声合成 / 動的特徴量 / 系列内変動 |
研究成果の概要 |
隠れマルコフモデルに基づく音声合成手法の性能の限界を超えて,より多様で自然な合成音声を生成するために,ノンパラメトリックモデルを用いた音声合成手法を確立することをめざして研究を行った。提案する音声合成手法におけるモデル化はガウス過程回帰に基づいており,入力テキストに対してフレーム単位で音声合成に必要なパラメータを予測するためのカーネル関数の設計,計算量削減手法,ハイパーパラメータの自動最適化手法,ガウス過程分類を導入した韻律情報のモデル化手法などの検討を行った。
|