• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自然なヒューマンコンピュータインタラクションのための話し言葉会話音声合成

研究課題

研究課題/領域番号 13J08776
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
研究分野 メディア情報学・データベース
研究機関東京工業大学

研究代表者

郡山 知樹  東京工業大学, 総合理工学研究科, 助教

研究期間 (年度) 2013-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
2,300千円 (直接経費: 2,000千円、間接経費: 300千円)
2014年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2013年度: 1,000千円 (直接経費: 1,000千円)
キーワード音声合成 / 話し言葉 / 統計的機械学習 / ガウス過程回帰 / 隠れマルコフモデル / 統計的音声合成 / ノンパラメトリックベイズ
研究実績の概要

今日まで音声合成で広く研究の対象となっていたものは朗読調・アナウンス調の音声であった。近年の研究により、比較的低コストで楽しげや怒りといった感情表現・発話様式を再現することが可能であることが報告されているが、日常会話で用いられるような話し言葉調の自然な音声を合成できるまでには至っていない。その理由として、自発的な会話音声に含まれる疑問や確認などの発話意図や「ああ」「うん」などのフィラーといった多様な表現を実現するための、データベースの構築・音声の説明変数の選択・モデル化手法に対して十分な検討が行われていないという問題点がある。
研究代表者は隠れマルコフモデルに基づく音声合成(HMM音声合成)を話し言葉調の音声に適用する手法として、従来手法である音素単位のモデル化に対し、疑問に含まれる上昇調などの韻律的イベントを単位とするモデル化手法を提案した。しかし、HMM音声合成における状態単位のモデル化という制約から自然な話し言葉会話音声の生成には至らなかった。
そこで、本研究ではHMMのように状態単位ではなくフレーム単位で音声をモデル化するガウス過程回帰に基づく新たな音声合成手法(GPR音声合成)を提案した。読み上げ調の音声に対し、音声の音韻を表すスペクトルおよび韻律を表すF0のモデル化を行い、従来のHMM音声合成に比べ自然性の高い音声を合成できることを示した。GPR音声合成は柔軟性の高い手法であり、話し言葉に特有の入力変数の導入が容易であることから、今後話し言葉会話音声における自然性の向上に繋がると考えられる。

現在までの達成度 (段落)

26年度が最終年度であるため、記入しない。

今後の研究の推進方策

26年度が最終年度であるため、記入しない。

報告書

(2件)
  • 2014 実績報告書
  • 2013 実績報告書
  • 研究成果

    (9件)

すべて 2015 2014 2013

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (8件)

  • [雑誌論文] Statistical Parametric Speech Synthesis Based on Gaussian Process Regression2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 8 号: 2 ページ: 173-183

    • DOI

      10.1109/jstsp.2013.2283461

    • 関連する報告書
      2014 実績報告書 2013 実績報告書
    • 査読あり / 謝辞記載あり
  • [学会発表] Prosody Generation Using Frame-based Gaussian Process Regression and Classification for Statistical Parametric Speech Synthesis2015

    • 著者名/発表者名
      Tomoki Koriyama, Takao Kobayashi
    • 学会等名
      ICASSP 2015
    • 発表場所
      Brisbane Convention & Exhibition Centre, Brisbane, Australia
    • 年月日
      2015-04-19 – 2015-04-24
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Parametric Speech Synthesis Using Local and Global Sparse Gaussian Processes2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 学会等名
      The 24th IEEE International Workshop on Machine Learning for Signal Processing
    • 発表場所
      Reims Centre des Congres, Reims, France
    • 年月日
      2014-09-21 – 2014-09-24
    • 関連する報告書
      2014 実績報告書
  • [学会発表] Parametric Speech Synthesis Based on Gaussian Process Regression Using Global Variance and Hyperparameter Optimization2014

    • 著者名/発表者名
      Tomoki Koriyama, Takashi Nose, Takao Kobayashi
    • 学会等名
      ICASSP 2014
    • 発表場所
      Fortezza dal Basso, Florence, Italy
    • 年月日
      2014-05-04 – 2014-05-09
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 系列内変動を考慮したガウス過程回帰に基づく音声パラメータ生成2014

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2014年春期研究発表会
    • 発表場所
      日本大学理工学部 駿河台キヤンパス
    • 関連する報告書
      2013 実績報告書
  • [学会発表] ガウス過程回帰に基づく音声合成におけるハイパーパラメータ最適化の検討2014

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      電子情報通信学会1月音声研究会
    • 発表場所
      名城大学 天白キャンパス
    • 関連する報告書
      2013 実績報告書
  • [学会発表] Frame-level Acoustic Modeling Based on Gaussian Process Regression for Statistical Nonparametric Speech Synthesis2013

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      The 38^<th> International Conference on Acoustics, Speech, and Signal Processing
    • 発表場所
      Vancouver Convention & Exhibition Centre, Canada
    • 関連する報告書
      2013 実績報告書
  • [学会発表] Statistical nonparametric speech synthesis using sparse Gaussian processes2013

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      14^<th> Annual Conference of the International Speech Communication Association
    • 発表場所
      Lyon Convention Center, France
    • 関連する報告書
      2013 実績報告書
  • [学会発表] スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成2013

    • 著者名/発表者名
      郡山 知樹
    • 学会等名
      日本音響学会2013年秋期研究発表会
    • 発表場所
      豊橋技術科学大学
    • 関連する報告書
      2013 実績報告書

URL: 

公開日: 2014-01-29   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi