• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

生成過程モデルに基づく表現力豊かな多言語音声合成とそれによる音声自動翻訳

研究課題

研究課題/領域番号 21300061
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関東京大学

研究代表者

広瀬 啓吉  東京大学, 大学院・情報理工学系研究科, 教授 (50111472)

研究分担者 峯松 信明  東京大学, 情報理工学系研究科, 准教授 (90273333)
連携研究者 河合 剛  北海道大学, メディア・コミュニケーション研究院, 准教授 (70312981)
研究期間 (年度) 2009 – 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
2011年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2010年度: 5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2009年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
キーワード生成過程モデル / 基本周波数パターン / コーパスベース韻律制御 / 音声自動翻訳 / 談話焦点 / HMM音声合成 / 声質と調子 / 音声モーフィング / 発話スタイル / 声調核 / 多言語 / 音素長 / 発話焦点
研究概要

基本周波数パターン生成過程モデル(F_0モデル)の枠組みで、多言語の韻律制御の研究を統合的に進め、F_0モデルの指令の差分に着目した韻律の適応手法を開発し、焦点制御、調子の変換、話者変換を実現した。さらに、学習音声コーパスF_0パターンあるいは生成されるF_0パターンのF_0モデル近似を行い、HMM音声合成の品質向上を達成するとともに、焦点付与を達成した。成果に立脚し、談話・意図を再現する音声翻訳の実験を行った。

報告書

(4件)
  • 2011 実績報告書   研究成果報告書 ( PDF )
  • 2010 実績報告書
  • 2009 実績報告書
  • 研究成果

    (33件)

すべて 2012 2011 2010 2009 その他

すべて 雑誌論文 (13件) (うち査読あり 13件) 学会発表 (16件) 図書 (3件) 備考 (1件)

  • [雑誌論文] A method for generation of Mandarin F_0 contours based on tone nucleus model and superpositional model2012

    • 著者名/発表者名
      Qinghua Sun, Keikichi Hirose, and Nobuaki Minematsu
    • 雑誌名

      Speech Communication

      巻: Vol.54, Issue 8 ページ: 932-945

    • URL

      http://www.sciencedirect.com/science/journal/01676393

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] HMM-based F_0 contour synthesis using the generation process model2012

    • 著者名/発表者名
      Tatsuya Matsuda, Keikichi Hirose, and Nobuaki Minematsu
    • 雑誌名

      Acoustical Science and Technology, Acoustical Society of Japan

    • NAID

      110007969995

    • URL

      https://www.jstage.jst.go.jp/browse/ast/33/0/_contents,http://journals.acoustics.jp/ast-archive/

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] Improvement of prosody in HMM-based speech synthesis using generation process model2011

    • 著者名/発表者名
      Miaomiao Wang, Keikichi Hirose, and Nobuaki Minematsu
    • 雑誌名

      Journal of Signal Processing

      巻: vol.15, no.4 ページ: 279-282

    • URL

      http://www.risp.jp/Product.html

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] Improvement of prosody in HMM-based speech synthesis using generation process model2011

    • 著者名/発表者名
      Miaomiao Wang
    • 雑誌名

      Journal of Research Institute of Signal Processing

      巻: 15 ページ: 279-282

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Adaptation of prosody in speech synthesis by changing command values of the generation process model of fundamental frequency2011

    • 著者名/発表者名
      Keikichi Hirose
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: 1 ページ: 2793-2796

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] HMM-based F_0 contour synthesis using the generation process model2011

    • 著者名/発表者名
      Tatsuya Matsuda
    • 雑誌名

      Acoustical Science and Technology, Acoustical Society of Japan

      巻: (印刷中)(掲載確定)

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Improvement of prosody in HMM-based speech synthesis using generation process model2011

    • 著者名/発表者名
      Miaomiao Wang
    • 雑誌名

      Journal of Signal Processing

      巻: 15(7月号掲載)

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] HMM-based synthesis of fundamental frequency contours using the generation process model2010

    • 著者名/発表者名
      Tetsuya Matsuda, Keikichi Hirose and Nobuaki Minematsu
    • 雑誌名

      Journal of Signal Processing

      巻: vol.14, no.4 ページ: 277-280

    • URL

      http://www.risp.jp/Product.html

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] MM-based synthesis of fundamental frequency contours using the generation process model2010

    • 著者名/発表者名
      Tetsuya Matsuda
    • 雑誌名

      Journal of Signal Processing

      巻: 14 ページ: 277-280

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Improving Mandarin segmental duration prediction with automatically extracted syntax features2010

    • 著者名/発表者名
      Miaomiao Wen
    • 雑誌名

      Proceedings of INTERSPEECH

      巻: 1 ページ: 2178-2181

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] HMM-Based synthesis of fundamental frequency contours using the generation process model2010

    • 著者名/発表者名
      Tetsuya Matsuda
    • 雑誌名

      Proceedings of International Workshop on Nonlinear Circuits and Signal Processing 1

      ページ: 464-467

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Generation of fundamental frequency in HMM-based TTS using generation process model2010

    • 著者名/発表者名
      Miaomiao Wang
    • 雑誌名

      Proceedings of International Conference on Speech Prosody 1(印刷中,掲載確定)

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Control of prosodic focus in corpus-based generation of fundamental frequency contours of Japanese based on the generation process model2009

    • 著者名/発表者名
      Keiko Ochi
    • 雑誌名

      Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing 1

      ページ: 4485-4488

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] Fundamental frequency contour generation process model for improved and flexible control of prosodic features in hmm-based speech synthesis2012

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      International Symposium on Frontiers of Research on Speech and Music
    • 発表場所
      KIIT, Gurgaon, India(招待講演)
    • 年月日
      2012-01-19
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Improved automatic extraction of generation process model commands and its use for generating fundamental frequency contours for training HMM-based speech synthesis2012

    • 著者名/発表者名
      Hiroya Hashimoto, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings INTERSPEECH
    • 発表場所
      Portland
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Emotional voice conversion for mandarin using tone nucleus model-small corpus and high efficiency2012

    • 著者名/発表者名
      Miaomiao Wang, Miaomiao Wen, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings of International Conference on Speech Prosody
    • 発表場所
      Shanghai
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Fundamental frequency contour reshaping in HMM-based speech synthesis and realization of prosodic focus using generation process model2012

    • 著者名/発表者名
      Keikichi Hirose, Hiroya Hashimoto, Jun Ikeshima, and Nobuaki Minematsu
    • 学会等名
      Proceedings of International Conference on Speech Prosody
    • 発表場所
      Shanghai
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Fundamental frequency contour generation process model for improved and flexible control of prosodic features in hmm-based speech synthesis2012

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      Proceedings of International Symposium on Frontiers of Research on Speech and Music
    • 発表場所
      Gurgaon
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Representing fundamental frequency contours generated by hmm-based speech synthesis using generation process model2011

    • 著者名/発表者名
      Keikichi Hirose, Tatsuya Matsuda, Hiroya Hashimoto, and Nobuaki Minematsu
    • 学会等名
      Proceedings of IEEE International Workshop on Machine Learning for Signal Processing
    • 発表場所
      Beijing
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Adaptation of prosody in speech synthesis by changing command values of the generation process model of fundamental frequency2011

    • 著者名/発表者名
      Keikichi Hirose, Keiko Ochi, Ryusuke Mihara, Hiroya Hashimoto, Daisuke Saito, and Nobuaki Minematsu
    • 学会等名
      Proceedings INTERSPEECH
    • 発表場所
      Florence
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Prosody conversion for emotional Mandarin speech synthesis using the tone nucleus model2011

    • 著者名/発表者名
      Miaomiao Wen, Miaomiao Wang, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings INTERSPEECH
    • 発表場所
      Florence
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Control of prosodic features in corpus-based generation of fundamental frequency contours based on the generation process model2010

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      IEEE International Conference on Signal Processing
    • 発表場所
      Taiyangdao Hotel, Beijing, Chin
    • 年月日
      2010-10-27
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Analysis and Synthesis of F_0 Contours for Bangla Readout Speech2010

    • 著者名/発表者名
      Shyamal Das Mandal, Anal Haque Warsi, Tulika Basu, Keikichi Hirose, and Hiroya Fujisaki
    • 学会等名
      Proceedings Oriental COCOSDA
    • 発表場所
      Kathmandu
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Control of prosodic features in corpus-based generation of fundamental frequency contours based on the generation process model2010

    • 著者名/発表者名
      Keikichi Hirose, Keiko Ochi, and Nobuaki Minematsu
    • 学会等名
      Proceedings IEEE International Conference on Signal Processing
    • 発表場所
      Beijing
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Improved generation of fundamental frequency in HMM-based speech synthesis using generation process model2010

    • 著者名/発表者名
      Miaomiao Wang, Miaomiao Wen, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings INTERSPEECH
    • 発表場所
      Makuhari
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Using F_0 contour generation process model for improved and flexible control of prosodic features in HMM-based speech synthesis2010

    • 著者名/発表者名
      Keikichi Hirose, Keiko Ochi, Miaomiao Wang, Tatsuya Matsuda, Miaomiao Wen, and Nobuaki Minematsu
    • 学会等名
      Proceedings of 21^<st> Conference on Electronic Speech Signal Processing
    • 発表場所
      Berlin
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Generation of fundamental frequency in HMM-based TTS using generation process model2010

    • 著者名/発表者名
      Miaomiao Wang, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings of International Conference on Speech Prosody
    • 発表場所
      Chicago
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Control of prosodic features based on the super-positional representation of F_0 contours -toward flexible control of prosodic features in speech synthesis-2009

    • 著者名/発表者名
      Keikichi Hirose
    • 学会等名
      International Workshop on Spoken Language Prosody
    • 発表場所
      C-DAC, Kolkata, India
    • 年月日
      2009-11-25
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Control of prosodic focus in corpus-based generation of fundamental frequency contours of Japanese based on the generation process model2009

    • 著者名/発表者名
      Keiko Ochi, Keikichi Hirose, and Nobuaki Minematsu
    • 学会等名
      Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing
    • 発表場所
      Taipei
    • 関連する報告書
      2011 研究成果報告書
  • [図書] Prosodic corpora based on F_0 contour generation model and automatic extraction of model parameters2010

    • 著者名/発表者名
      Keikichi Hirose
    • 出版者
      Computer Processing of Asian Spoken languages
    • 関連する報告書
      2011 研究成果報告書
  • [図書] Speech prosody corpora based on F_0 contour generation model and automatic extraction of model parameters, in Computer Processing of Asian Spoken languages, edited by Shuichi Itahashi et.al.2010

    • 著者名/発表者名
      Keikichi Hirose
    • 総ページ数
      372
    • 出版者
      Consideration Books, Los Angeles
    • 関連する報告書
      2009 実績報告書
  • [図書] On the prosodic features for emotional speech2009

    • 著者名/発表者名
      Keikichi Hirose, Qinghua Sun
    • 出版者
      Frontiers in Phonetics and Speech Science
    • 関連する報告書
      2011 研究成果報告書
  • [備考] (研究業績)

    • URL

      http://www.gavo.t.u-tokyo.ac.jp/~hirose/cv/curriculumvitae.pdf

    • 関連する報告書
      2011 研究成果報告書

URL: 

公開日: 2009-04-01   更新日: 2025-11-18  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi