2005 年度実績報告書

生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成

研究課題

研究課題/領域番号	17300055
研究機関	東京大学
研究代表者	広瀬啓吉東京大学, 大学院・情報理工学系研究科, 教授 (50111472)
研究分担者	峯松信明東京大学, 大学院・新領域創成科学研究科, 助教授 (90273333)
キーワード	生成過程モデル / 基本周波数パターン / 種々の調子 / 自動推定 / 統計的手法 / 感情 / 音声コーパス / アクセント属性
研究概要	音声コーパスから、その発話スタイルの音声合成を行う手法を確立するための研究を進め、以下の成果を達成した。 1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定する枠組みを確立し、詳細な解析を行った。 2.観測された基本周波数パターンから、統計的手法(2分木)により生成過程モデルの指令パラメータを自動推定する手法を開発し、発声の言語情報を入力に加えることで、学習音声話者以外の話者の音声の分析にも有効であることを示した。 3.声優(女性)1名が、ATR503文を、朗読及び怒り、喜び、悲しみの3種の感情で読み上げたものを収録した。感情音声については、文節毎に、話者が特に感情を込めたところをラベル付けした。音素ラベル付け、生成過程モデルに基づく韻律ラベル付けを行い、合成実験用音声コーパスとした。別のナレーター男女2名づつが朗読及び種々の調子(丁寧、ぞんざい、早口など)で発声したものも収録して、同様に処理し、音声コーパスとした。 4.上記1で開発した枠組みで、文節毎の感情の情報を入力に追加することにより、追加しない場合と比較して、より感情のこもった合成音声が得られることを、聴取実験により示した。音声合成はHMM音声合成法で行った。 5.単語のアクセント属性に基づき文節のアクセント型を決定する手法を開発した。アクセント属性として、従来のO型に代わりφ型を定義することにより、コンパクトな規則により、高い精度が得られることを示した。 6.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。

研究成果
(15件)

すべて 2006 2005

すべて雑誌論文 (14件) 図書 (1件)

[雑誌論文] Modeling and generation of prosodic features2006
- 著者名/発表者名
  Keikichi Hirose
- 雑誌名
  
  Spoken Language Systems (Ohm-sha)
  
  ページ: 73-86
[雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006
- 著者名/発表者名
  Jinfu Ni
- 雑誌名
  
  Speech Communication (発表予定)
[雑誌論文] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006
- 著者名/発表者名
  Quinghua Sun
- 雑誌名
  
  Proc. International Conference on Speech Prosody 発表予定
[雑誌論文] 種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)2006
- 著者名/発表者名
  広瀬啓吉
- 雑誌名
  
  日本音響学会講演論文集 CD-ROM
  
  ページ: 279-282
[雑誌論文] 文節単位での感情の程度を考慮した統計的韻律制御2006
- 著者名/発表者名
  浅野泰史
- 雑誌名
  
  日本音響学会講演論文集 CD-ROM
  
  ページ: 213-214
[雑誌論文] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006
- 著者名/発表者名
  河村美由紀
- 雑誌名
  
  日本音響学会講演論文集 CD-ROM
  
  ページ: 387-388
[雑誌論文] 音調核モデルに基づく中国語F_0パターンの2段階生成2006
- 著者名/発表者名
  孫慶華
- 雑誌名
  
  電子情報通信学会技術研究報告(音声研究会) SP2005-159
  
  ページ: 55-60
[雑誌論文] 柔軟な音声合成2005
- 著者名/発表者名
  広瀬啓吉
- 雑誌名
  
  パートナーロボット資料集成(エヌ・ティー・エス) 2章1節
  
  ページ: 58-67
[雑誌論文] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005
- 著者名/発表者名
  Keikichi Hirose
- 雑誌名
  
  Speech Communication 46・3-4
  
  ページ: 385-404
[雑誌論文] Corpus-based extraction of F_0 contour generation process model parameters2005
- 著者名/発表者名
  Keikichi Hirose
- 雑誌名
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  ページ: 3257-3260
[雑誌論文] Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model2005
- 著者名/発表者名
  Quinghua Sun
- 雑誌名
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  ページ: 3625-3628
[雑誌論文] Estimation of intonation variation with constrained tone transformations2005
- 著者名/発表者名
  Jinfu Ni
- 雑誌名
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  ページ: 1397-1400
[雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models (Plenary Talk)2005
- 著者名/発表者名
  Keikichi Hirose
- 雑誌名
  
  Proc. Speech Analysis, Synthesis and Recognition -Application of Phonetics- CD-ROM
  
  ページ: 8 pages
[雑誌論文] 日本語テキスト音声合成用アクセント結合規則の改良2005
- 著者名/発表者名
  黒岩龍
- 雑誌名
  
  日本音響学会講演論文集 CD-ROM
  
  ページ: 427-428
[図書] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2006
- 著者名/発表者名
  広瀬啓吉(編著)
- 総ページ数
  226
- 出版者
  丸善

2005 年度 実績報告書

生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成

研究代表者

広瀬 啓吉 東京大学, 大学院・情報理工学系研究科, 教授 (50111472)

研究成果

[雑誌論文] Modeling and generation of prosodic features2006

著者名/発表者名

雑誌名

[雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

著者名/発表者名

雑誌名

[雑誌論文] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006

著者名/発表者名

雑誌名

[雑誌論文] 種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)2006

著者名/発表者名

雑誌名

[雑誌論文] 文節単位での感情の程度を考慮した統計的韻律制御2006

著者名/発表者名

雑誌名

[雑誌論文] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006

著者名/発表者名

雑誌名

[雑誌論文] 音調核モデルに基づく中国語F_0パターンの2段階生成2006

著者名/発表者名

雑誌名

[雑誌論文] 柔軟な音声合成2005

著者名/発表者名

雑誌名

[雑誌論文] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005

著者名/発表者名

雑誌名

[雑誌論文] Corpus-based extraction of F_0 contour generation process model parameters2005

著者名/発表者名

雑誌名

[雑誌論文] Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model2005

著者名/発表者名

雑誌名

[雑誌論文] Estimation of intonation variation with constrained tone transformations2005

著者名/発表者名

雑誌名

[雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models (Plenary Talk)2005

著者名/発表者名

雑誌名

[雑誌論文] 日本語テキスト音声合成用アクセント結合規則の改良2005

著者名/発表者名

雑誌名

[図書] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2006

著者名/発表者名

総ページ数

出版者

2005 年度実績報告書

広瀬啓吉東京大学, 大学院・情報理工学系研究科, 教授 (50111472)