2010 年度実績報告書

バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

研究課題

研究課題/領域番号	22680016
研究機関	奈良先端科学技術大学院大学
研究代表者	戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)
キーワード	音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / リアルタイム処理 / 自動適応 / バリアフリー
研究概要	入力音声の特徴を自動的に学習しながら、リアルタイムで声質を自在に変換・制御できる次世代ボイスチェンジャー技術とその応用技術の構築を目指し、要素技術である高品質なリアルタイム声質変換法の構築(実施計画1)と自動オンラインモデル適応法の構築(実施計画2)に取り組んだ。高品質なリアルタイム声質変換法として、時間フレーム間相関を考慮した短遅延変換処理と高次統計量を考慮した変換音声強調処理を実現した。また、高い変換性能を保ったまま演算量の削減を行うために、全共分散混合正規分布モデルに対する同時対角化処理を導入するとともに、応用例の一つである肉伝導音声から通常音声への変換においては、残差波形を利用した変換法を提案し、その有効性を示した。自動オンラインモデル適応法として、最尤線形回帰処理に基づく変換モデルの教師無し適応法を提案した。また、適応データが少量しか得られない際に、より頑健な変換モデル適応処理を実現するために、最大事後確率推定処理を導入した。これらの適応法を様々な入力話者に対する変換処理(多対一変換)に適用し、従来法である固有声変換法と比較実験を行い、各手法の有効性を示した。さらに、声質制御処理に必要となる出力側におけるモデル構築・適応技術(一対多変換)についても検討した。固有声変換に基づく声質制御法を拡張することで、声質制御機能を保ちつつ、声質適応機能を改善する手法を提案した。また、非線形処理に基づく声質制御法を提案し、声質制御性能を改善できることを示した。さらに、音声翻訳システムの出力音声の声質制御という応用例において、声質制御・適応技術を導入し、その有効性を示した。

研究成果
(7件)

すべて 2011 2010

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (5件)

[雑誌論文] Adaptive Voice-Quality Control Based on One-to-Many Eigenvoice Conversion2010
- 著者名/発表者名
  Kumi Ohta
- 雑誌名
  
  Proceedings of INTERSPEECH
  
  巻: (CD-ROM) ページ: 2158-2161
- 査読あり
[雑誌論文] Linear Transformation Approaches to Many-to-One Voice Conversion2010
- 著者名/発表者名
  Chie Hayashida
- 雑誌名
  
  Proceedings of 7th ISCA Speech Synthesis Workshop
  
  巻: (CD-ROM) ページ: 74-79
- 査読あり
[学会発表] 残差波形の使用による肉伝導音声変換処理の演算量削減2011
- 著者名/発表者名
  出口大祐
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  東京都新宿区
- 年月日
  2011-03-11
[学会発表] 音声翻訳システムのための声質変換の性能評価2011
- 著者名/発表者名
  服部信彦
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  東京都新宿区
- 年月日
  2011-03-09
[学会発表] 食道音声強調における声質制御技術の検討2011
- 著者名/発表者名
  山本憲三
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  東京都新宿区
- 年月日
  2011-03-09
[学会発表] 音声翻訳システムのための声質変換法と日中英語間における評価2011
- 著者名/発表者名
  服部信彦
- 学会等名
  音声言語情報処理研究会
- 発表場所
  広島県福山市
- 年月日
  2011-02-05
[学会発表] 統計的声質変換に基づく食道音声強調における声質制御2011
- 著者名/発表者名
  山本憲三
- 学会等名
  音声言語情報処理研究会
- 発表場所
  広島県福山市
- 年月日
  2011-02-05

2010 年度 実績報告書

バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

研究代表者

戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)

研究成果

[雑誌論文] Adaptive Voice-Quality Control Based on One-to-Many Eigenvoice Conversion2010

著者名/発表者名

雑誌名

[雑誌論文] Linear Transformation Approaches to Many-to-One Voice Conversion2010

著者名/発表者名

雑誌名

[学会発表] 残差波形の使用による肉伝導音声変換処理の演算量削減2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声翻訳システムのための声質変換の性能評価2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 食道音声強調における声質制御技術の検討2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声翻訳システムのための声質変換法と日中英語間における評価2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 統計的声質変換に基づく食道音声強調における声質制御2011

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)