2005 Fiscal Year Annual Research Report

生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成

Research Project

Project/Area Number	17300055
Research Institution	The University of Tokyo
Principal Investigator	広瀬啓吉東京大学, 大学院・情報理工学系研究科, 教授 (50111472)
Co-Investigator(Kenkyū-buntansha)	峯松信明東京大学, 大学院・新領域創成科学研究科, 助教授 (90273333)
Keywords	生成過程モデル / 基本周波数パターン / 種々の調子 / 自動推定 / 統計的手法 / 感情 / 音声コーパス / アクセント属性
Research Abstract	音声コーパスから、その発話スタイルの音声合成を行う手法を確立するための研究を進め、以下の成果を達成した。 1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定する枠組みを確立し、詳細な解析を行った。 2.観測された基本周波数パターンから、統計的手法(2分木)により生成過程モデルの指令パラメータを自動推定する手法を開発し、発声の言語情報を入力に加えることで、学習音声話者以外の話者の音声の分析にも有効であることを示した。 3.声優(女性)1名が、ATR503文を、朗読及び怒り、喜び、悲しみの3種の感情で読み上げたものを収録した。感情音声については、文節毎に、話者が特に感情を込めたところをラベル付けした。音素ラベル付け、生成過程モデルに基づく韻律ラベル付けを行い、合成実験用音声コーパスとした。別のナレーター男女2名づつが朗読及び種々の調子(丁寧、ぞんざい、早口など)で発声したものも収録して、同様に処理し、音声コーパスとした。 4.上記1で開発した枠組みで、文節毎の感情の情報を入力に追加することにより、追加しない場合と比較して、より感情のこもった合成音声が得られることを、聴取実験により示した。音声合成はHMM音声合成法で行った。 5.単語のアクセント属性に基づき文節のアクセント型を決定する手法を開発した。アクセント属性として、従来のO型に代わりφ型を定義することにより、コンパクトな規則により、高い精度が得られることを示した。 6.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。

Research Products
(15 results)

All 2006 2005

All Journal Article (14 results) Book (1 results)

[Journal Article] Modeling and generation of prosodic features2006
- Author(s)
  Keikichi Hirose
- Journal Title
  
  Spoken Language Systems (Ohm-sha)
  
  Pages: 73-86
[Journal Article] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006
- Author(s)
  Jinfu Ni
- Journal Title
  
  Speech Communication (発表予定)
[Journal Article] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006
- Author(s)
  Quinghua Sun
- Journal Title
  
  Proc. International Conference on Speech Prosody 発表予定
[Journal Article] 種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)2006
- Author(s)
  広瀬啓吉
- Journal Title
  
  日本音響学会講演論文集 CD-ROM
  
  Pages: 279-282
[Journal Article] 文節単位での感情の程度を考慮した統計的韻律制御2006
- Author(s)
  浅野泰史
- Journal Title
  
  日本音響学会講演論文集 CD-ROM
  
  Pages: 213-214
[Journal Article] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006
- Author(s)
  河村美由紀
- Journal Title
  
  日本音響学会講演論文集 CD-ROM
  
  Pages: 387-388
[Journal Article] 音調核モデルに基づく中国語F_0パターンの2段階生成2006
- Author(s)
  孫慶華
- Journal Title
  
  電子情報通信学会技術研究報告(音声研究会) SP2005-159
  
  Pages: 55-60
[Journal Article] 柔軟な音声合成2005
- Author(s)
  広瀬啓吉
- Journal Title
  
  パートナーロボット資料集成(エヌ・ティー・エス) 2章1節
  
  Pages: 58-67
[Journal Article] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005
- Author(s)
  Keikichi Hirose
- Journal Title
  
  Speech Communication 46・3-4
  
  Pages: 385-404
[Journal Article] Corpus-based extraction of F_0 contour generation process model parameters2005
- Author(s)
  Keikichi Hirose
- Journal Title
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  Pages: 3257-3260
[Journal Article] Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model2005
- Author(s)
  Quinghua Sun
- Journal Title
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  Pages: 3625-3628
[Journal Article] Estimation of intonation variation with constrained tone transformations2005
- Author(s)
  Jinfu Ni
- Journal Title
  
  Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
  
  Pages: 1397-1400
[Journal Article] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models (Plenary Talk)2005
- Author(s)
  Keikichi Hirose
- Journal Title
  
  Proc. Speech Analysis, Synthesis and Recognition -Application of Phonetics- CD-ROM
  
  Pages: 8 pages
[Journal Article] 日本語テキスト音声合成用アクセント結合規則の改良2005
- Author(s)
  黒岩龍
- Journal Title
  
  日本音響学会講演論文集 CD-ROM
  
  Pages: 427-428
[Book] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2006
- Author(s)
  広瀬啓吉(編著)
- Total Pages
  226
- Publisher
  丸善

2005 Fiscal Year Annual Research Report

生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成

Principal Investigator

広瀬 啓吉 東京大学, 大学院・情報理工学系研究科, 教授 (50111472)

Research Products

[Journal Article] Modeling and generation of prosodic features2006

Author(s)

Journal Title

[Journal Article] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

Author(s)

Journal Title

[Journal Article] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006

Author(s)

Journal Title

[Journal Article] 種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)2006

Author(s)

Journal Title

[Journal Article] 文節単位での感情の程度を考慮した統計的韻律制御2006

Author(s)

Journal Title

[Journal Article] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006

Author(s)

Journal Title

[Journal Article] 音調核モデルに基づく中国語F_0パターンの2段階生成2006

Author(s)

Journal Title

[Journal Article] 柔軟な音声合成2005

Author(s)

Journal Title

[Journal Article] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005

Author(s)

Journal Title

[Journal Article] Corpus-based extraction of F_0 contour generation process model parameters2005

Author(s)

Journal Title

[Journal Article] Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model2005

Author(s)

Journal Title

[Journal Article] Estimation of intonation variation with constrained tone transformations2005

Author(s)

Journal Title

[Journal Article] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models (Plenary Talk)2005

Author(s)

Journal Title

[Journal Article] 日本語テキスト音声合成用アクセント結合規則の改良2005

Author(s)

Journal Title

[Book] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2006

Author(s)

Total Pages

Publisher

広瀬啓吉東京大学, 大学院・情報理工学系研究科, 教授 (50111472)