• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

ロバスト音声合成の深化と多言語音声コミュニケーションへの展開

研究課題

研究課題/領域番号 24300071
研究機関東京工業大学

研究代表者

小林 隆夫  東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)

研究分担者 能勢 隆  東北大学, 工学(系)研究科(研究院), 講師 (90550591)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワードテキスト音声合成 / HMM音声合成 / 基本周波数正規化学習 / 韻律ラベリング / クロスリンガル音声合成 / 国際情報交換(インドネシア)
研究実績の概要

ロバスト音声合成技術の深化・発展を目指し、第二年度まで得られた成果を基に研究を進め、基本技術に関する理論的検討、提案手法の高度化を行うと共に、ロバスト音声合成の多言語への応用に関してタイ語、インドネシア語、英語について検討を行い、以下の成果が得られた。
1.表現性にロバストな音声合成法:日本語合成音声のアクセント型の誤りを減らすために、アクセント型高低パタンに基づく基本周波数正規化学習の検討を行い、評価実験を通して有効性を示した。また、統計的音声合成手法の新たなアプローチであるガウス過程回帰に基づく音声合成手法に関して、従来の隠れマルコフモデルに基づく手法で有効性が示されている系列内変動と動的特徴量を提案手法にも導入することにより、性能がさらに改善できることを示した。
2.自発音声・会話音声の合成:品質の高い合成音声を得るためには、適切にコンテキストラベリングされた学習データが必要であるが、人手による正確なラベリング作業は高コストになる問題がある。これに対し、日本語文音声音声のアクセント句・アクセント型に関する自動韻律ラベリング手法を提案し、手動ラベリングと同等な合成音声が得られることを示した。
3.音声資源が乏しい言語の音声合成:タイ語音声合成において、トーン(声調)の再現性向上に有効なストレスコンテキストを自動でラベリングする手法を提案してその有効性を示した。また、インドネシア語音声合成に対しては、前年度に収録した男女各1名の音声データを用いて、プロトタイプ音声合成システムを検討した。
4.多言語の音声合成:共有決定木を利用した話者適応に基づくクロスリンガル音声合成手法について、英語・日本語を対象としたシステムのより詳細な検討を行った。さらに、モデルの性能を向上するために、新たな英語・日本語バイリンガル音声データの収録とラベリングを行った。

現在までの達成度 (段落)

26年度が最終年度であるため、記入しない。

今後の研究の推進方策

26年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

26年度が最終年度であるため、記入しない。

次年度使用額の使用計画

26年度が最終年度であるため、記入しない。

  • 研究成果

    (24件)

すべて 2015 2014

すべて 雑誌論文 (13件) (うち査読あり 9件、 謝辞記載あり 13件、 オープンアクセス 3件) 学会発表 (11件)

  • [雑誌論文] ガウス過程回帰に基づく音声合成システムの検討2015

    • 著者名/発表者名
      郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2015年春季研究発表会講演論文集

      巻: CD-ROM ページ: 269-270

    • 謝辞記載あり
  • [雑誌論文] 言語モデルと音響モデルを用いた自動韻律ラベリングの評価2015

    • 著者名/発表者名
      増子理菜, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2015年春季研究発表会講演論文集

      巻: CD-ROM ページ: 361-362

    • 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

    • 著者名/発表者名
      岡元伶洋, 郡山知樹, 小林隆夫
    • 雑誌名

      日本音響学会2015年春季研究発表会講演論文集

      巻: CD-ROM ページ: 371-372

    • 謝辞記載あり
  • [雑誌論文] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

    • 著者名/発表者名
      Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proceedings of 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing

      巻: ICASSP 2015 ページ: 4929-4933

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Statistical parametric speech synthesis based on Gaussian process regression2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 8 ページ: 173-183

    • DOI

      10.1109/JSTSP.2013.2283461

    • 査読あり / 謝辞記載あり
  • [雑誌論文] A parameter generation algorithm using local variance for HMM-based speech synthesis2014

    • 著者名/発表者名
      Takashi Nose, Vataya Chunwijitra, Takao Kobayashi
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 8 ページ: 221-228

    • DOI

      10.1109/JSTSP.2013.2283459

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing

      巻: ICASSP 2014 ページ: 3862-3866

    • DOI

      10.1109/ICASSP.2014.6854319

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Tone modeling using stress information for HMM-based Thai speech synthesis2014

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of the 7th International Conference on Speech Prosody

      巻: SPEECHPROSODY 7 ページ: 1057-1061

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Transform mapping using shared decision tree context clustering for HMM-based cross-lingual speech synthesis2014

    • 著者名/発表者名
      Daiki Nagahama, Takashi Nose, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proceedings of the 15th Annual Conference of the International Speech Communication Association

      巻: INTERSPEECH 2014 ページ: 770-774

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Accent type and phrase boundary estimation using acoustic and language models for automatic prosodic labeling2014

    • 著者名/発表者名
      Tomoki Koriyama, Hiroshi Suzuki, Takashi Nose, Takahiro Shinozaki, Takao Kobayashi
    • 雑誌名

      Proceedings of the 15th Annual Conference of the International Speech Communication Association

      巻: INTERSPEECH 2014 ページ: 2337-2341

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Parametric speech synthesis using local and global sparse Gaussian processes2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      Proceedings of IEEE International Workshop on Machine Learning for Signal Processing

      巻: MLSP 2014 ページ: 1-6

    • DOI

      10.1109/MLSP.2014.6958921

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] HMM-based Thai speech synthesis using unsupervised stress context labeling2014

    • 著者名/発表者名
      Decha Moungsri, Tomoki Koriyama, Takao Kobayashi
    • 雑誌名

      Proceedings of 2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference

      巻: APSIPA ASC 2014 ページ: 1-4

    • DOI

      10.1109/APSIPA.2014.7041599

    • 査読あり / 謝辞記載あり
  • [雑誌論文] ガウス過程回帰に基づくF0パタン生成の検討2014

    • 著者名/発表者名
      郡山知樹, 能勢 隆, 小林隆夫
    • 雑誌名

      日本音響学会2014年秋季研究発表会講演論文集

      巻: CD-ROM ページ: 247-248

    • 謝辞記載あり
  • [学会発表] Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis2015

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      2015 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2015
    • 発表場所
      Brisbane Convention & Exhibition Centre(オーストラリア)
    • 年月日
      2015-04-19 – 2015-04-24
  • [学会発表] 言語モデルと音響モデルを用いた自動韻律ラベリングの評価2015

    • 著者名/発表者名
      増子 理菜
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス(東京)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] ガウス過程回帰に基づく音声合成システムの検討2015

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス(東京)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] ガウス過程回帰に基づく音声合成のためのコンテキストの検討2015

    • 著者名/発表者名
      岡元 伶洋
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学後楽園キャンパス(東京)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] HMM-based Thai speech synthesis using unsupervised stress context labeling2014

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2014
    • 発表場所
      Sokha Angkor Resort(カンボジア)
    • 年月日
      2014-12-09 – 2014-12-12
  • [学会発表] Parametric speech synthesis using local and global sparse Gaussian processes2014

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      International Workshop on Machine Learning for Signal Processing, MLSP2014
    • 発表場所
      Reims Centre De Congres(フランス)
    • 年月日
      2014-09-21 – 2014-09-24
  • [学会発表] Transform mapping using shared decision tree context clustering for HMM-based cross-lingual speech synthesis2014

    • 著者名/発表者名
      Daiki Nagahama
    • 学会等名
      The 15th Annual Conference of the International Speech Communication Association, INTERSPEECH 2014
    • 発表場所
      Singapore Expo(シンガポール)
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] Accent type and phrase boundary estimation using acoustic and language models for automatic prosodic labeling2014

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      The 15th Annual Conference of the International Speech Communication Association, INTERSPEECH 2014
    • 発表場所
      Singapore Expo(シンガポール)
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] ガウス過程回帰に基づくF0パタン生成の検討2014

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学豊平キャンパス
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] Tone modeling using stress information for HMM-based Thai speech synthesis2014

    • 著者名/発表者名
      Decha Moungsri
    • 学会等名
      The 7th International Conference on Speech Prosody, SPEECHPROSODY 7
    • 発表場所
      トリニティカレッジ(アイルランド)
    • 年月日
      2014-05-20 – 2014-05-23
  • [学会発表] Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization2014

    • 著者名/発表者名
      Tomoki Koriyama
    • 学会等名
      2014 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2014
    • 発表場所
      "Fortezza Da Basso” Convention & Exhibition Centre (イタリア)
    • 年月日
      2014-05-04 – 2014-05-09

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi