2006 年度実績報告書

任意のユーザーを対象とする統計的声質変換・制御法の構築に関する研究

研究課題

研究課題/領域番号	18680018
研究機関	奈良先端科学技術大学院大学
研究代表者	戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90403328)
キーワード	音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / 音韻性 / 話者性 / 固有声
研究概要	声質変換は、入力音声の言語情報を保ったまま話者性等の非言語情報を変換する技術である。既存の方式では、変換モデルを学習するために、入力話者と出力話者が同一内容を発声したパラレルデータ(50文対程度)が必須となる。そのため、入力・出力話者に対する負担が大きく、そもそもパラレルデータが収録不可能な話者間では変換モデルを学習できない。この問題を解決する方式として、特定の話者の声を任意の話者の声へと変換する一対多変換方式と、任意の話者の声を特定の話者の声へと変換する多対一変換方式を提案した。特定話者と多数の事前収録話者のパラレルデータを用いる事で、音韻性と話者性を分離して表現できる初期変換モデルの学習を実現した(実施項目1に相当)。また、未知の入力/出力話者に対する変換モデルを構築するために、初期変換モデルの教師無し適応を実現した(実施項目2に相当)。以上の処理を行う一手法として固有声変換法を提案し、一対多変換及び多対一変換においてその高い有効性を示した(実施項目2、3に相当)。一対多変換においては、少量パラメータ操作による変換音声の声質制御も実現した(実施項目3に相当)。さらに、話者正規化学習法を導入する事で、固有声変換法の性能改善を行った(項目外)。声質変換の応用例として、言語非依存ボイスチェンジャー、肉伝導音声の品質改善、携帯電話音声の帯域拡張、発声障がい者補助、調音音響変換に基づく音声生成モデルの実現などが考えられる。今後これらの応用例において提案法の評価を行うために、音声データ収録を行った(実施項目4に相当)。さらに、各応用例において、これまでに我々が開発した従来方式の声質変換法の性能評価を行い、その高い有効性を確認した(項目外)。また、多対一変換アルゴリズムとして使用可能な話者選択法に関して、音声認識・対話においてその有効性を示した(項目外)。

研究成果
(28件)

すべて 2007 2006

すべて雑誌論文 (27件) 産業財産権 (1件)

[雑誌論文] Reducing Computation Time of the Rapid Unsupervised Speaker Adaptation Based on HMM-Sufficient Statistics2007
- 著者名/発表者名
  Randy Gomez
- 雑誌名
  
  IEICE Transactions on Information and Systems E90-D, 2
  
  ページ: 554-561
[雑誌論文] 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム2007
- 著者名/発表者名
  中村圭吾
- 雑誌名
  
  電子情報通信学会論文誌 J90-D, 3
  
  ページ: 780-787
[雑誌論文] One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices2007
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  Proceeding of International Conference on Acoustics, Speech, and Signal Processing(ICASSP) (CD-ROM)
  
  ページ: 1249-1252
[雑誌論文] Performance Evaluation of the Rapid Unsupervised Speaker Adaptation Based on HMM-Sufficient Statistics Integrated in a Dialogue System2007
- 著者名/発表者名
  Randy Gomez
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 1-P-23
  
  ページ: 169-170
[雑誌論文] 時系列マッチングを含む統計モデルに基づく声質変換2007
- 著者名/発表者名
  中村憲一
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 1-8-11
  
  ページ: 213-214
[雑誌論文] 音源特徴量および発話内変動を考慮した固有声に基づく声質変換2007
- 著者名/発表者名
  大谷大和
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 1-8-12
  
  ページ: 215-216
[雑誌論文] 最尤変換法による携帯電話音声の帯域拡張2007
- 著者名/発表者名
  藤敦渉
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 1-8-13
  
  ページ: 217-218
[雑誌論文] 喉頭摘出者の会話支援における微弱な外部音源信号が声質変換精度に与える影響2007
- 著者名/発表者名
  中村圭吾
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 2-8-2
  
  ページ: 331-332
[雑誌論文] On the Use of Phonetic Information for Mapping from Articulatory Movements to Vocal Tract Spectrum2006
- 著者名/発表者名
  Kenichi Nakamura
- 雑誌名
  
  Proceeding of International Conference on Acoustics, Speech, and Signal Processing(ICASSP) (CD-ROM)
  
  ページ: 93-96
[雑誌論文] Improving Rapid Unsupervised Speaker Adaptation Based on HMM Sufficient Statistics2006
- 著者名/発表者名
  Randy Gomez
- 雑誌名
  
  Proceeding of International Conference on Acoustics, Speech, and Signal Processing(ICASSP) (CD-ROM)
  
  ページ: 1001-1004
[雑誌論文] Speaking Aid System for Total Laryngectomees Using Voice Conversion of Body Transmitted Artificial Speech2006
- 著者名/発表者名
  Keigo Nakamura
- 雑誌名
  
  Proceeding of Interspeech2006-ICSLP (CD-ROM)
  
  ページ: 1395-1398
[雑誌論文] Maximum Likelihood Voice Conversion Based on GMM with STRAIGHT Mixed Excitation2006
- 著者名/発表者名
  Yamato Ohtani
- 雑誌名
  
  Proceeding of Interspeech2006-ICSLP (CD-ROM)
  
  ページ: 2266-2269
[雑誌論文] Improving Body Transmitted Unvoiced Speech with Statistical Voice Conversion2006
- 著者名/発表者名
  Mikihiro Nakagiri
- 雑誌名
  
  Proceeding of Interspeech2006-ICSLP (CD-ROM)
  
  ページ: 2270-2273
[雑誌論文] Voice Conversion Based on Mixtures of Factor Analyzers2006
- 著者名/発表者名
  Yosuke Uto
- 雑誌名
  
  Proceeding of Interspeech2006-ICSLP (CD-ROM)
  
  ページ: 2278-2281
[雑誌論文] Eigenvoice Conversion Based on Gaussian Mixture Model2006
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  Proceeding of Interspeech2006-ICSLP (CD-ROM)
  
  ページ: 2446-2449
[雑誌論文] Improving Quality of Small Body Transmitted Ordinary Speech with Statistical Voice Conversion2006
- 著者名/発表者名
  Hidehiko Sekimoto
- 雑誌名
  
  4^<th> Joint Meeting of the ASA and the ASJ 120・5
  
  ページ: 3036
[雑誌論文] Evaluation of Eigenvoice Conversion Based on Gaussian Mixture Model2006
- 著者名/発表者名
  Yamato Ohtani
- 雑誌名
  
  4^<th> Joint Meeting of the ASA and the ASJ 120・5
  
  ページ: 3036
[雑誌論文] A Speech Communication Aid System for Total Laryngectomees Using Voice Conversion of Body Transmitted Artificial Speech2006
- 著者名/発表者名
  Keigo Nakamura
- 雑誌名
  
  4^<th> Joint Meeting of the ASA and the ASJ 120・5
  
  ページ: 3351
[雑誌論文] 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換2006
- 著者名/発表者名
  中村圭吾
- 雑誌名
  
  電子情報通信学会福祉情報工学研究会技術報告 WIT2006-12
  
  ページ: 65-70
[雑誌論文] 固有声に基づく声質変換法2006
- 著者名/発表者名
  戸田智基
- 雑誌名
  
  電子情報通信学会音声研究会技術報告 SP2006-39
  
  ページ: 25-30
[雑誌論文] 固有声に基づく声質変換のための話者正規化学習法2006
- 著者名/発表者名
  大谷大和
- 雑誌名
  
  電子情報通信学会音声研究会技術報告 SP2006-40
  
  ページ: 31-36
[雑誌論文] 統計的声質変換による肉伝導小声の音質改善2006
- 著者名/発表者名
  関本英彦
- 雑誌名
  
  電子情報通信学会音声研究会技術報告 SP2006-41
  
  ページ: 37-42
[雑誌論文] Improving Rapid MLLR-Based Unsupervised Speaker Adaptation Using HMM-Sufficient Statistics2006
- 著者名/発表者名
  Randy Gomez
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 2-2-8
  
  ページ: 67-68
[雑誌論文] 喉頭摘出者の音声コミュニケーション支援を目指した肉伝導人工音声の声質変換2006
- 著者名/発表者名
  中村圭吾
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 1-6-9
  
  ページ: 171-172
[雑誌論文] 固有声に基づく声質変換・制御法2006
- 著者名/発表者名
  戸田智基
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 1-6-13
  
  ページ: 179-180
[雑誌論文] 固有声に基づく声質変換における話者正規化学習の導入2006
- 著者名/発表者名
  大谷大和
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 1-6-14
  
  ページ: 181-182
[雑誌論文] 小声発話様式における肉伝導音声の音質改善2006
- 著者名/発表者名
  関本英彦
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 1-6-15
  
  ページ: 183-184
[産業財産権] 声質変換モデル生成装置及び声質変換システム2006
- 発明者名
  戸田智基, 大谷大和, 舛田剛志
- 権利者名
  奈良先端科学技術大学院大学, 旭化成株式会社
- 産業財産権番号
  特願2006-236422
- 出願年月日
  2006-08-31

2006 年度 実績報告書

任意のユーザーを対象とする統計的声質変換・制御法の構築に関する研究

研究代表者

戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90403328)

研究成果

[雑誌論文] Reducing Computation Time of the Rapid Unsupervised Speaker Adaptation Based on HMM-Sufficient Statistics2007

著者名/発表者名

雑誌名

[雑誌論文] 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム2007

著者名/発表者名

雑誌名

[雑誌論文] One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices2007

著者名/発表者名

雑誌名

[雑誌論文] Performance Evaluation of the Rapid Unsupervised Speaker Adaptation Based on HMM-Sufficient Statistics Integrated in a Dialogue System2007

著者名/発表者名

雑誌名

[雑誌論文] 時系列マッチングを含む統計モデルに基づく声質変換2007

著者名/発表者名

雑誌名

[雑誌論文] 音源特徴量および発話内変動を考慮した固有声に基づく声質変換2007

著者名/発表者名

雑誌名

[雑誌論文] 最尤変換法による携帯電話音声の帯域拡張2007

著者名/発表者名

雑誌名

[雑誌論文] 喉頭摘出者の会話支援における微弱な外部音源信号が声質変換精度に与える影響2007

著者名/発表者名

雑誌名

[雑誌論文] On the Use of Phonetic Information for Mapping from Articulatory Movements to Vocal Tract Spectrum2006

著者名/発表者名

雑誌名

[雑誌論文] Improving Rapid Unsupervised Speaker Adaptation Based on HMM Sufficient Statistics2006

著者名/発表者名

雑誌名

[雑誌論文] Speaking Aid System for Total Laryngectomees Using Voice Conversion of Body Transmitted Artificial Speech2006

著者名/発表者名

雑誌名

[雑誌論文] Maximum Likelihood Voice Conversion Based on GMM with STRAIGHT Mixed Excitation2006

著者名/発表者名

雑誌名

[雑誌論文] Improving Body Transmitted Unvoiced Speech with Statistical Voice Conversion2006

著者名/発表者名

雑誌名

[雑誌論文] Voice Conversion Based on Mixtures of Factor Analyzers2006

著者名/発表者名

雑誌名

[雑誌論文] Eigenvoice Conversion Based on Gaussian Mixture Model2006

著者名/発表者名

雑誌名

[雑誌論文] Improving Quality of Small Body Transmitted Ordinary Speech with Statistical Voice Conversion2006

著者名/発表者名

雑誌名

[雑誌論文] Evaluation of Eigenvoice Conversion Based on Gaussian Mixture Model2006

著者名/発表者名

雑誌名

[雑誌論文] A Speech Communication Aid System for Total Laryngectomees Using Voice Conversion of Body Transmitted Artificial Speech2006

著者名/発表者名

雑誌名

[雑誌論文] 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換2006

著者名/発表者名

雑誌名

[雑誌論文] 固有声に基づく声質変換法2006

著者名/発表者名

雑誌名

[雑誌論文] 固有声に基づく声質変換のための話者正規化学習法2006

著者名/発表者名

雑誌名

[雑誌論文] 統計的声質変換による肉伝導小声の音質改善2006

著者名/発表者名

雑誌名

[雑誌論文] Improving Rapid MLLR-Based Unsupervised Speaker Adaptation Using HMM-Sufficient Statistics2006

著者名/発表者名

雑誌名

[雑誌論文] 喉頭摘出者の音声コミュニケーション支援を目指した肉伝導人工音声の声質変換2006

著者名/発表者名

雑誌名

[雑誌論文] 固有声に基づく声質変換・制御法2006

著者名/発表者名

雑誌名

2006 年度実績報告書

戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90403328)