• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

統計的に一貫した基準に基づく声質変換手法の構築

研究課題

研究課題/領域番号 24700166
研究機関名古屋工業大学

研究代表者

南角 吉彦  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)

研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード声質変換
研究実績の概要

本研究では,ごく少量のデータでスペクトル情報と韻律情報,話速などを統一的に変換する声質変換手法を構築した.従来の声質変換手法が音色を表すスペクトル情報のみに注目していたのに対し,提案法では,声の高さや抑揚・話速など,話者性を含むすべての情報を統一的に扱うため,相互の相関を利用してより高精度な声質変換を実現することができる.評価実験においては,スペクトル情報と基本周波数を同時にモデル化することによって,変換性能が改善されることが示された.また,継続長モデルを含む統計モデルに基づいたスペクトル特徴と話速の同時変換についても有効性が示された.
また,近年,音声認識や音声合成で適用されたベイズ基準を声質変換に適用し,ごく少量のデータで瞬時に高精度な変換器を構築するための枠組みを提案した.従来の声質変換で用いられてきた尤度最大化(ML)基準では,モデルパラメータを点推定するため,学習データが少量の際に推定精度が低下するという問題があった.これに対しベイズ基準ではモデルパラメータを周辺化することによって高い汎化性能を得ることができる.また,ベイズ基準ではデータに関する事前情報を利用ことによって,モデルの推定精度を高めることができる.本研究では,この事前分布の設定において,因子分析に基づいて構造化された事前分布を利用する手法を提案した.この手法では,多数の話者の音声データから因子分析の構造を利用して,あらかじめ効率的な話者表現を自動的に取得し,対象話者の音声データがごく少量の場合においても,精度良くモデル化を行うことができる.評価実験において,ベイズ基準の近似である事後確率最大化(MAP)基準に構造化事前分布を用いることにより,客観評価が改善することが示された.

  • 研究成果

    (8件)

すべて 2014

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件) (うち招待講演 1件)

  • [雑誌論文] Spectral modeling with contextual additive structure for HMM-based speech synthesis2014

    • 著者名/発表者名
      Shinji Takaki, Yoshihiko Nankaku and Keiichi Tokuda
    • 雑誌名

      IEEE Transactions on Audio, Speech, and Language Processing

      巻: Vol. 8, Issue 2 ページ: 229-238

    • DOI

      10.1109/JSTSP.2014.2305919

    • 査読あり
  • [雑誌論文] Integration of spectral feature extraction and modeling for HMM-based speech synthesis2014

    • 著者名/発表者名
      Kazuhiro Nakamura, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda
    • 雑誌名

      IEICE TRANSACTIONS on Information & Systems

      巻: vol.E97-D, no.6 ページ: 1438-1448

    • 査読あり
  • [学会発表] ニューラルネットワークに基づく音声合成における生成モデルの利用の検討2014

    • 著者名/発表者名
      橋本佳,大浦圭一郎,南角吉彦,徳田恵一
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 因子分析に基づくHMM音声合成における基底クラスタリングの検討2014

    • 著者名/発表者名
      吉村建慶,橋本佳,南角吉彦,徳田恵一
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] H/L型アクセント推定と音響モデリングを統合したHMM音声合成の検討2014

    • 著者名/発表者名
      神谷翔大,橋本佳,大浦圭一郎,南角吉彦,徳田恵一
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 統計的機械学習問題としての音声研究2014

    • 著者名/発表者名
      南角吉彦
    • 学会等名
      電子情報通信学会 音声研究会
    • 発表場所
      ホテル花巻
    • 年月日
      2014-07-24 – 2014-07-26
    • 招待講演
  • [学会発表] Integration of speaker and pitch adaptive training for HMM-based singing voice synthesis2014

    • 著者名/発表者名
      Kanako Shirota, Kazuhiro Nakamura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda
    • 学会等名
      2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 発表場所
      Florence Italy
    • 年月日
      2014-05-06 – 2014-05-09
  • [学会発表] HMM-based singing voice synthesis and its application to Japanese and English2014

    • 著者名/発表者名
      Kazuhiro Nakamura, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda
    • 学会等名
      2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 発表場所
      Florence Italy
    • 年月日
      2014-05-06 – 2014-05-09

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi