• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成

研究課題

研究課題/領域番号 17300055
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関東京大学

研究代表者

広瀬 啓吉  東京大学, 大学院・情報理工学系研究科, 教授 (50111472)

研究分担者 峯松 信明  東京大学, 大学院・新領域創成科学研究科, 准教授 (90273333)
研究期間 (年度) 2005 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
16,860千円 (直接経費: 15,300千円、間接経費: 1,560千円)
2007年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
2006年度: 5,100千円 (直接経費: 5,100千円)
2005年度: 5,000千円 (直接経費: 5,000千円)
キーワード生成過程モデル / 基本周波数パターン / コーパスベース手法 / 韻律制御 / 発話スタイル / HMM音声合成 / 焦点制御 / 音声対話システム / コーパスベース韻律制御 / 発話焦点 / 2段階処理 / 感情の程度 / 統計的手法 / 2段階手法 / 音声コーパス / 種々の調子 / 自動推定 / 感情 / アクセント属性
研究概要

基本周波数パターン生成過程のモデルを前提とし、コーパスベース手法により、任意の発話スタイルの音声を高品質に合成しうる音声合成手法を確立することを目的として研究を進めた結果、以下の成果をあげ、当初の計画を達成した。
1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定し、それによって基本周波数パターンを合成する手法を開発した。休止の位置と長さ、音素の長さを2分木により推定する手法と統合し、韻律制御手法を確立した。感情音声を始めとする種々のスタイルの音声合成を行って、手法の有効性を確認した。観測される基本周波数パターンについて、指令パラメータを2文木により自動的に抽出する手法を開発し、テキストの言語情報を入力とすることで、抽出精度が向上することを示した。
2.焦点を置いた発声の、特に置かない発声(基準発声)からのフレーズ指令、アクセント指令の差分を、アクセント型、文中の位置、及び基準発声の指令等を入力として推定する2分木を構築した。上記1に差分を適用することにより、焦点制御を良好に行い得ることを示した。
3.フレーズ成分をルールベース、声調成分をコーパスベースで生成する2段階処理の柔軟な基本周波数パターン生成手法を中国語音声について開発し、焦点制御等をルールベースで行い得ることを示した。
4.上記1,2で開発した手法とHMM音声合成を組み合わせた日本語・中国語音声合成システムを構築し、HMM音声合成の韻律制御よりも、自然性の高い合成音声が得られることを示した。また、種々の発話スタイルの合成音声が得られることを示した。
5.上記音声合成システムを用いた道案内音声対話システム、番組案内音声対話システムを構築し、ユーザの特徴や状況によって応答音声の発話スタイルを制御することを行い、開発した音声合成手法の有効性を実証した。

報告書

(4件)
  • 2007 実績報告書   研究成果報告書概要
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (57件)

すべて 2008 2007 2006 2005

すべて 雑誌論文 (48件) (うち査読あり 9件) 学会発表 (6件) 図書 (3件)

  • [雑誌論文] Speech prosody in spoken language technologies2008

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Journal of Signal Processing 12

      ページ: 7-16

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 実績報告書 2007 研究成果報告書概要
  • [雑誌論文] Improved prediction of tone components for F_0 contour generation of Mandarin speech based on tone nucleus model2008

    • 著者名/発表者名
      Qinghua Sun
    • 雑誌名

      Proceedings of International Conference on Speech Prosody 1

      ページ: 95-98

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Speech prosody in spoken language technologies2008

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Journal of Signal Processing Vol.12, No.1

      ページ: 7-16

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Improved prediction of tone components for F_0 contour generation of Mandarin speech based on tone nucleus model2008

    • 著者名/発表者名
      Qinghua Sun, Keikichi Hirose, Nobuaki Minematsu
    • 雑誌名

      Proceedings of International Conference on Speech Prosody, Campinas Vol.1

      ページ: 95-98

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] 道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価2007

    • 著者名/発表者名
      八木裕司
    • 雑誌名

      情報処理学会論文誌 48

      ページ: 3300-3308

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on super positional and tone nucleus models2007

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Archives of Acoustics 32

      ページ: 41-50

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Realization of concept-to-speech conversion for reply speech generation in a spoken dialogue system of road guidance and its evaluation2007

    • 著者名/発表者名
      Yuji Yagi, Seiya Takada, Keikichi Hirose, Nobuaki Minematsu
    • 雑誌名

      IPSJ (Information Processing Society of Japan) Journal vol.48, no.9

      ページ: 3300-3308

    • NAID

      110006423006

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models2007

    • 著者名/発表者名
      Keikichi Hirose, Qinghua Sun, Nobuaki Minematsu
    • 雑誌名

      Archives of Acoustics Vol.32, No.1

      ページ: 41-50

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] 道案内音声対話システムへの概念音声合成に基づく応答生成手法の実装とその評価2007

    • 著者名/発表者名
      八木 裕司
    • 雑誌名

      情報処理学会論文誌 48

      ページ: 3300-3308

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Corpus-based generation of prosodic features from text based on generation process model2007

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings of Interspeech 1(CD-ROM)

      ページ: 1274-1277

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models2007

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Archives of Acoustics 32・1

      ページ: 41-50

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Prosody in spoken language technologies(Special Lecture)2007

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings of International Workshop on Nonlinear Circuits and Signal Processing(NCSP2007) CD-ROM

      ページ: 615-622

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Generation of sentence F0 contours for Mandarin speech synthesis by superposing tone components on phrase components2007

    • 著者名/発表者名
      Qinghua Sun
    • 雑誌名

      Proceedings of International Workshop on Nonlinear Circuits and Signal Processing(NCSP2007) CD-ROM

      ページ: 317-320

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 日本語音声合成を目的としたアクセント処理のための規則と統計的学習2007

    • 著者名/発表者名
      黒岩龍
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 301-302

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 道案内対話システムにおける応答音声の評価2007

    • 著者名/発表者名
      八木裕司
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 9-10

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 基本周波数パターン生成過程モデルを用いたテキストからのコーパスベース韻律生成とその評価2007

    • 著者名/発表者名
      越智景子
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 231-232

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

    • 著者名/発表者名
      Jinfu Ni
    • 雑誌名

      Speech Communication 48

      ページ: 989-1008

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Constrained tone transformation technique for separation and combination of Mandarin tone and intonation2006

    • 著者名/発表者名
      Jinfu Ni
    • 雑誌名

      Journal of Acoustical Society of America 119

      ページ: 1764-1782

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Corpus-based generation of fundamental frequency contours using generation process model and considering emotional focuses2006

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings Interspeech 2006 1

      ページ: 305-308

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

    • 著者名/発表者名
      Jinfu Ni, Keikichi Hirose
    • 雑誌名

      Speech Communication Vol.48, No.8

      ページ: 989-1008

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Constrained tone transformation technique for separation and combination of Mandarin tone and intonation2006

    • 著者名/発表者名
      Jinfu Ni, Hisashi Kawai, Keikichi Hirose
    • 雑誌名

      Journal of Acoustical Society of America Vol.119, No.3

      ページ: 1764-1782

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Corpus-based generation of fundamental frequency contours using generation process model and considering emotional focuses2006

    • 著者名/発表者名
      Keikichi Hirose, Yasufumi Asano, Nobuaki Minematsu
    • 雑誌名

      Proceedings Interspeech 2006, Pittsburgh Vol.1

      ページ: 305-308

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

    • 著者名/発表者名
      Jinfu Ni
    • 雑誌名

      Speech Communication 62・5

      ページ: 370-378

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Modeling the effects of emphasis and question on fundamental frequency contours of Cantonese utterances2006

    • 著者名/発表者名
      Wentao Gu
    • 雑誌名

      IEEE Transactions on Speech and Audio Processing 14・4

      ページ: 1155-1170

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Corpus-based synthesis of fundamental frequency contours using generation process model and automatic preparation of training corpora(Plenary)2006

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Conference Guide for Oriental COCOSDA 2006 - International Conference on Speech Databases and Assessment

      ページ: 12-12

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006

    • 著者名/発表者名
      Qinghua Sun
    • 雑誌名

      Proceedings of International Conference on Speech Prosody 2

      ページ: 561-564

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Corpus-based generation of fundamental frequency contours using generation process model and considering emotional focuses2006

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings of Interspeech 2006-ICSLP CD-ROM

      ページ: 305-308

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 生成過程モデルによるコーパスベース韻律制御のための休止推定2006

    • 著者名/発表者名
      越智景子
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 269-270

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Modeling and generation of prosodic features2006

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Spoken Language Systems (Ohm-sha)

      ページ: 73-86

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin2006

    • 著者名/発表者名
      Jinfu Ni
    • 雑誌名

      Speech Communication (発表予定)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Rule-based generation of phrase components in two-step synthesis of fundamental frequency contours of Mandarin2006

    • 著者名/発表者名
      Quinghua Sun
    • 雑誌名

      Proc. International Conference on Speech Prosody 発表予定

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)2006

    • 著者名/発表者名
      広瀬 啓吉
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 279-282

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 文節単位での感情の程度を考慮した統計的韻律制御2006

    • 著者名/発表者名
      浅野 泰史
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 213-214

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価2006

    • 著者名/発表者名
      河村 美由紀
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 387-388

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 音調核モデルに基づく中国語F_0パターンの2段階生成2006

    • 著者名/発表者名
      孫慶華
    • 雑誌名

      電子情報通信学会技術研究報告(音声研究会) SP2005-159

      ページ: 55-60

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Speech Communication 48

      ページ: 385-404

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Corpus-based extraction of F_0 contour generation process model parameters2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings Inerspeech 2005 1

      ページ: 3257-3260

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
    • 査読あり
  • [雑誌論文] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora : Application to emotional speech synthesis2005

    • 著者名/発表者名
      Keikichi Hirose, Kentaro Sato, Yasufumi Asano, Nobuaki Minematsu
    • 雑誌名

      Speech Communication Vol.46, Nos.3-4

      ページ: 385-404

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Corpus-based extraction of F_0 contour generation process model parameters2005

    • 著者名/発表者名
      Keikichi Hirose, Yusuke Furuyama, Nobuaki Minematsu
    • 雑誌名

      Proceedings Inerspeech 2005, Lisbon Vol.1

      ページ: 3257-3260

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Prosody generation based on generation process model2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Prosody in spoken language information processing -Science of accent, intonation, and rhythm- (218 pages), Edited by K. Hirose, Maruzen

      ページ: 109-118

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] Modeling and generation of prosodic features2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Spoken Language Systems (347 pages), Edited by S. Nakagawa, M. Okada, and T. Kawahara, Ohm-sha

      ページ: 73-86

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [雑誌論文] 柔軟な音声合成2005

    • 著者名/発表者名
      広瀬啓吉
    • 雑誌名

      パートナーロボット資料集成(エヌ・ティー・エス) 2章1節

      ページ: 58-67

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Synthesis of F_0 contours using generation process model parameters predicted from unlabeled corpora: Application to emotional speech synthesis2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Speech Communication 46・3-4

      ページ: 385-404

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Corpus-based extraction of F_0 contour generation process model parameters2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM

      ページ: 3257-3260

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model2005

    • 著者名/発表者名
      Quinghua Sun
    • 雑誌名

      Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM

      ページ: 3625-3628

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Estimation of intonation variation with constrained tone transformations2005

    • 著者名/発表者名
      Jinfu Ni
    • 雑誌名

      Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM

      ページ: 1397-1400

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Synthesis of fundamental frequency contours for Standard Chinese based on superpositional and tone nucleus models (Plenary Talk)2005

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proc. Speech Analysis, Synthesis and Recognition -Application of Phonetics- CD-ROM

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 日本語テキスト音声合成用アクセント結合規則の改良2005

    • 著者名/発表者名
      黒岩 龍
    • 雑誌名

      日本音響学会講演論文集 CD-ROM

      ページ: 427-428

    • 関連する報告書
      2005 実績報告書
  • [学会発表] Generation of F_0 contours for Mandarin speech in combination with rule-based and corpus-based methods2008

    • 著者名/発表者名
      Keikichi Hirose, Qinghua Sun, Nobuaki Minematsu
    • 学会等名
      8th Phonetics Conference of China/International Symposium on Phonetic Frontiers
    • 発表場所
      Beijing (Invited)
    • 年月日
      2008-04-19
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] 基本周波数パターン生成過程モデルに基づくコーパスベース韻律制御における焦点制御2008

    • 著者名/発表者名
      越智 景子
    • 学会等名
      日本音響学会
    • 発表場所
      千葉工業大学
    • 年月日
      2008-03-18
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Researches on speech prosody for advanced spoken language technologies2008

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      Proceedings of International Symposium: Frontiers of Research on Speech and Music
    • 発表場所
      Kolkata
    • 年月日
      2008-02-20
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] Researches on speech prosody for advanced spoken language technologies2008

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      International Symposium : Frontiers of Research on Speech and Music
    • 発表場所
      Kolkata (Invited)
    • 年月日
      2008-02-20
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] Corpus-based generation of prosodic features from text based on generation process model2007

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      Interspeech 2007
    • 発表場所
      Antwerp
    • 年月日
      2007-08-28
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [学会発表] Corpus-based synthesis of fundamental frequency contours using generation process model and automatic preparation of training corpora2006

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      International Conference on Speech Databases and Assessment
    • 発表場所
      Penang (Keynote)
    • 年月日
      2006-12-09
    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [図書] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2006

    • 著者名/発表者名
      広瀬 啓吉(編著)
    • 総ページ数
      226
    • 出版者
      丸善
    • 関連する報告書
      2005 実績報告書
  • [図書] 韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-2005

    • 著者名/発表者名
      広瀬啓吉(編著)
    • 総ページ数
      218
    • 出版者
      丸善
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要
  • [図書] Spoken Language Systems (Modeling and generation of prosodic features)2005

    • 著者名/発表者名
      Keikichi Hirose
    • 出版者
      オーム社
    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2007 研究成果報告書概要

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi