2013 Fiscal Year Annual Research Report
次世代ヒューマノイド音声合成に向けたコーパスデザインに基づく音声多様化技術の研究
Project/Area Number |
23700195
|
Research Institution | Tohoku University |
Principal Investigator |
能勢 隆 東北大学, 工学(系)研究科(研究院), 講師 (90550591)
|
Keywords | 音声合成 / 統計モデル / 隠れマルコフモデル / 感情音声 / コーパスデザイン / 話し言葉音声合成 |
Research Abstract |
本研究課題は、人間に近いより自然で多様な音声合成システムの実現を目指すものであり、研究期間全体を通じて以下の7項目について研究成果が得られた。 (1)対話音声合成のための効率的なコーパスデザイン法の確立▼アクセント、スタイル、文末表現などを総合的に考慮した音声コーパス構築法を提案し、その有効性を示した。(2)ユーザの主観に基づいた感情音声合成▼ユーザによる主観的な感情の度合を定量化してモデル学習に組み込む新たな枠組を提案し、その有効性を示した。 (3)話し言葉音声合成のための韻律モデルの改善▼韻律の変動要因としてToBIラベルに基づく詳細な情報を導入した韻律単位HMMを提案し、その有効性を示した。(4)教師なし学習に基づく強調音声の合成▼強調表現を含む音声を自動的に生成するため、声の高さを表す基本周波数(F0)に着目し、F0生成を利用した強調表現の自動ラベリングを実現した。(5)多様なスタイル音声生成のためのスタイル変換法の提案▼複数の話者の通常音声と感情音声の間で変換行列を推定しこれを目標話者の通常音声のモデルに適用することで目標話者の読み上げ音声のみから多様なスタイルを伴う音声を生成できることを示した。(6)歌声合成におけるスタイル制御法の提案▼スタイルとその度合いを直観的に変化させることができる重回帰隠れセミマルコフモデルに基づく歌唱スタイル制御法を提案した。(7)共有決定木に基づくクロスリンガル音声合成▼言語の多様化手法として、目標話者の母国語音声のみからその話者の外国語音声を合成する手法を提案した。
|
Research Products
(13 results)
-
-
-
-
-
[Journal Article] HMM-based expressive speech synthesis based on phrase-level F0 context labeling2013
Author(s)
Yu Maeno, Takashi Nose, Takao Kobayashi, Tomoki Koriyama, Yusuke Ijima, Hideharu Nakajima, Hideyuki Mizuno, Osamu Yoshioka
-
Journal Title
Proc. 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013
Volume: vol.1
Pages: 7859-7863
Peer Reviewed
-
-
-
-
-
-
-
-