2007 年度実績報告書

任意のユーザーを対象とする統計的声質変換・制御法に関する研究

研究課題

研究課題/領域番号	18680018
研究機関	奈良先端科学技術大学院大学
研究代表者	戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)
キーワード	音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / 音韻性 / 話者性 / 固有声
研究概要	声質変換は、入力音声の言語情報を保つたまま話者性等の非言語情報を変換する技術である。前年度までに、従来の特定話者ペアに対する変換方式とは大きく異なる枠組みとして、任意の話者の声を特定の話者の声へと変換する多対一変換方式と、特定の話者の声を任意の話者の声へと変換する一対多変換方式を提案した。本年度は、多対一変換方式の適応データ量に対する頑健性を向上させるために、話者正規化学習法と最大事後確率推定に基づく固有声変換法を提案し、その有効性を評価した。その結果、約0.3秒といった極少量の発声を適応データとして用いた際においても、高い性能を持つ変換モデルを構築できることを示した(実施項目1に相当)。また、一対多声質変換方式において、声質表現語に基づく変換音声の声質手動制御を実現するために、重回帰混合正規分布モデルに基づく声質変換・制御法を提案し、その有効性を示した(実施項目2に相当)。さらに性能を改善する手法も提案し、その有効性を示した(項目外)。これらの研究と平行して、多対多声質変換法に関する検討も進めた(実施項目3に相当)。声質変換の応用例として、肉伝導音声の品質改善、携帯電話音声の帯域拡張、発声障害者補助などを想定し、提案法の適用及び評価を行うための音声データ収録を行った(実施項目4に相当)。さらに、各応用例において、本研究課題で開発している声質変換法の基礎アルゴリズムの性能評価を行い、その高い有効性を確認した(項目外)。以上の研究成果をまとめ、論文及び国際会議等で研究発表を行った。

研究成果
(23件)

すべて 2008 2007

すべて雑誌論文 (9件) (うち査読あり 9件) 学会発表 (14件)

[雑誌論文] Bandwidth Extension of Cellular Phone Speech Based on Maximum Likelihood Estimation with GMM2008
- 著者名/発表者名
  Wataru Fujitsuru
- 雑誌名
  
  Proceeding of NCSP (CD-ROM)
- 査読あり
[雑誌論文] A Speech Parameter Generation Algorithm Considering Global Variance for HMM-Based Speech Synthesis2007
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  IEICE Transactions on Information and Systems E90-D
  
  ページ: 816-824
- 査読あり
[雑誌論文] Voice Conversion Based on Maximum Likelihood Estimation of Spectral Parameter Trajectory2007
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  IEEE Transactions on Audio, Speech, and Language Processing 18
  
  ページ: 2222-2235
- 査読あり
[雑誌論文] Statistical Mapping between Articiilatory Movements and Acoustic Spectrum Using a Gaussian Mixture Model2007
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  Speech Communication 50
  
  ページ: 215-227
- 査読あり
[雑誌論文] One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices2007
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  Proceeding of ICASSP (CD-ROM)
- 査読あり
[雑誌論文] Regression Approaches to Voice Quality Control Based on One-to-Many Eigenvoice Conversion2007
- 著者名/発表者名
  Kumi Ohta
- 雑誌名
  
  Proceeding of SSW6 (CD-ROM)
  
  ページ: 101-106
- 査読あり
[雑誌論文] An Evaluation of Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets2007
- 著者名/発表者名
  Daisuke Tani
- 雑誌名
  
  Proceeding of SSW6 (CD-ROM)
  
  ページ: 107-112
- 査読あり
[雑誌論文] Speaker Adaptive Training for One-to-Many Eigenvoice Conversion Based on Gaussian Mixture Model2007
- 著者名/発表者名
  Yamato Ohtani
- 雑誌名
  
  Proceeding of Interspeech2007-EUROSPEECH (CD-ROM)
  
  ページ: 1981-1984
- 査読あり
[雑誌論文] Impact of Various Small Sound Source Signals on Voice Conversion Accuracy in Speech Sommunication2007
- 著者名/発表者名
  Keigo Nakamura
- 雑誌名
  
  Proceeding of Interspeech2007-EUROSPEECH (CD-ROM)
  
  ページ: 2517-2520
- 査読あり
[学会発表] 適応データ量に頑健な多対一固有声変換法2008
- 著者名/発表者名
  谷大輔
- 学会等名
  日本音響学会春季研究発表会講演論文集
- 発表場所
  千葉
- 年月日
  2008-03-19
[学会発表] 一対多固有声変換に基づく声質制御法の拡張2008
- 著者名/発表者名
  太田久美
- 学会等名
  日本音響学会春季研究発表会講演論文集
- 発表場所
  千葉
- 年月日
  2008-03-18
[学会発表] 微弱振動子とNAMマイクを用いた発話障害者補助2008
- 著者名/発表者名
  中村圭吾
- 学会等名
  情報処理学会全国大会講演論文集
- 発表場所
  茨城
- 年月日
  2008-03-14
[学会発表] 固有声に基づく高品質一対多声質変換2007
- 著者名/発表者名
  大谷大和
- 学会等名
  音響学会関西支部第10回若手研究者交流研究発表会
- 発表場所
  兵庫
- 年月日
  2007-11-29
[学会発表] 統計的声質変換を応用した人工音声の自然性改善に関する検討2007
- 著者名/発表者名
  中村圭吾
- 学会等名
  音響学会関西支部第10回若手研究者交流研究発表会
- 発表場所
  兵庫
- 年月日
  2007-11-29
[学会発表] 事前収録話者データを用いた多対一声質変換法2007
- 著者名/発表者名
  谷大輔
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  長崎
- 年月日
  2007-10-26
[学会発表] 一対多固有声変換に基づく声質制御法の評価2007
- 著者名/発表者名
  太田久美
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  長崎
- 年月日
  2007-10-26
[学会発表] 一対多固有声変換に基づく声質制御法に関する予備的検討2007
- 著者名/発表者名
  太田久美
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  山梨
- 年月日
  2007-09-19
[学会発表] 話者選択及び固有声に基づく多対一声質変換法とその評価2007
- 著者名/発表者名
  谷大輔
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  山梨
- 年月日
  2007-09-19
[学会発表] 微弱音源を用いた喉頭摘出者音声から健常者ささやき声への声質変換の評価2007
- 著者名/発表者名
  中村圭吾
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  山梨
- 年月日
  2007-09-19
[学会発表] 広帯域符号化方式との比較による最尤変換法に基づく帯域拡張の評価2007
- 著者名/発表者名
  藤敦渉
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  山梨
- 年月日
  2007-09-19
[学会発表] 喉頭摘出者データを用いた人工音声変換システムの評価2007
- 著者名/発表者名
  中村圭吾
- 学会等名
  電子情報通信学会福祉情報工学研究会技術報告
- 発表場所
  東京
- 年月日
  2007-08-03
[学会発表] 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討2007
- 著者名/発表者名
  中村圭吾
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  富山
- 年月日
  2007-07-27
[学会発表] GMMに基づく最尤変換法による携帯電話音声の帯域拡張2007
- 著者名/発表者名
  藤敦渉
- 学会等名
  情報処理学会音声言語情報処理研究会研究報告
- 発表場所
  宮城
- 年月日
  2007-07-21

2007 年度 実績報告書

任意のユーザーを対象とする統計的声質変換・制御法に関する研究

研究代表者

戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)

研究成果

[雑誌論文] Bandwidth Extension of Cellular Phone Speech Based on Maximum Likelihood Estimation with GMM2008

著者名/発表者名

雑誌名

[雑誌論文] A Speech Parameter Generation Algorithm Considering Global Variance for HMM-Based Speech Synthesis2007

著者名/発表者名

雑誌名

[雑誌論文] Voice Conversion Based on Maximum Likelihood Estimation of Spectral Parameter Trajectory2007

著者名/発表者名

雑誌名

[雑誌論文] Statistical Mapping between Articiilatory Movements and Acoustic Spectrum Using a Gaussian Mixture Model2007

著者名/発表者名

雑誌名

[雑誌論文] One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices2007

著者名/発表者名

雑誌名

[雑誌論文] Regression Approaches to Voice Quality Control Based on One-to-Many Eigenvoice Conversion2007

著者名/発表者名

雑誌名

[雑誌論文] An Evaluation of Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets2007

著者名/発表者名

雑誌名

[雑誌論文] Speaker Adaptive Training for One-to-Many Eigenvoice Conversion Based on Gaussian Mixture Model2007

著者名/発表者名

雑誌名

[雑誌論文] Impact of Various Small Sound Source Signals on Voice Conversion Accuracy in Speech Sommunication2007

著者名/発表者名

雑誌名

[学会発表] 適応データ量に頑健な多対一固有声変換法2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 一対多固有声変換に基づく声質制御法の拡張2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 微弱振動子とNAMマイクを用いた発話障害者補助2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 固有声に基づく高品質一対多声質変換2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 統計的声質変換を応用した人工音声の自然性改善に関する検討2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 事前収録話者データを用いた多対一声質変換法2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 一対多固有声変換に基づく声質制御法の評価2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 一対多固有声変換に基づく声質制御法に関する予備的検討2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 話者選択及び固有声に基づく多対一声質変換法とその評価2007

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 微弱音源を用いた喉頭摘出者音声から健常者ささやき声への声質変換の評価2007

著者名/発表者名

学会等名

2007 年度実績報告書

戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)