2010 Fiscal Year Annual Research Report

バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

Research Project

Project/Area Number	22680016
Research Institution	Nara Institute of Science and Technology
Principal Investigator	戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)
Keywords	音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / リアルタイム処理 / 自動適応 / バリアフリー
Research Abstract	入力音声の特徴を自動的に学習しながら、リアルタイムで声質を自在に変換・制御できる次世代ボイスチェンジャー技術とその応用技術の構築を目指し、要素技術である高品質なリアルタイム声質変換法の構築(実施計画1)と自動オンラインモデル適応法の構築(実施計画2)に取り組んだ。高品質なリアルタイム声質変換法として、時間フレーム間相関を考慮した短遅延変換処理と高次統計量を考慮した変換音声強調処理を実現した。また、高い変換性能を保ったまま演算量の削減を行うために、全共分散混合正規分布モデルに対する同時対角化処理を導入するとともに、応用例の一つである肉伝導音声から通常音声への変換においては、残差波形を利用した変換法を提案し、その有効性を示した。自動オンラインモデル適応法として、最尤線形回帰処理に基づく変換モデルの教師無し適応法を提案した。また、適応データが少量しか得られない際に、より頑健な変換モデル適応処理を実現するために、最大事後確率推定処理を導入した。これらの適応法を様々な入力話者に対する変換処理(多対一変換)に適用し、従来法である固有声変換法と比較実験を行い、各手法の有効性を示した。さらに、声質制御処理に必要となる出力側におけるモデル構築・適応技術(一対多変換)についても検討した。固有声変換に基づく声質制御法を拡張することで、声質制御機能を保ちつつ、声質適応機能を改善する手法を提案した。また、非線形処理に基づく声質制御法を提案し、声質制御性能を改善できることを示した。さらに、音声翻訳システムの出力音声の声質制御という応用例において、声質制御・適応技術を導入し、その有効性を示した。

Research Products
(7 results)

All 2011 2010

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results)

[Journal Article] Adaptive Voice-Quality Control Based on One-to-Many Eigenvoice Conversion2010
- Author(s)
  Kumi Ohta
- Journal Title
  
  Proceedings of INTERSPEECH
  
  Volume: (CD-ROM) Pages: 2158-2161
- Peer Reviewed
[Journal Article] Linear Transformation Approaches to Many-to-One Voice Conversion2010
- Author(s)
  Chie Hayashida
- Journal Title
  
  Proceedings of 7th ISCA Speech Synthesis Workshop
  
  Volume: (CD-ROM) Pages: 74-79
- Peer Reviewed
[Presentation] 残差波形の使用による肉伝導音声変換処理の演算量削減2011
- Author(s)
  出口大祐
- Organizer
  日本音響学会春季研究発表会
- Place of Presentation
  東京都新宿区
- Year and Date
  2011-03-11
[Presentation] 音声翻訳システムのための声質変換の性能評価2011
- Author(s)
  服部信彦
- Organizer
  日本音響学会春季研究発表会
- Place of Presentation
  東京都新宿区
- Year and Date
  2011-03-09
[Presentation] 食道音声強調における声質制御技術の検討2011
- Author(s)
  山本憲三
- Organizer
  日本音響学会春季研究発表会
- Place of Presentation
  東京都新宿区
- Year and Date
  2011-03-09
[Presentation] 音声翻訳システムのための声質変換法と日中英語間における評価2011
- Author(s)
  服部信彦
- Organizer
  音声言語情報処理研究会
- Place of Presentation
  広島県福山市
- Year and Date
  2011-02-05
[Presentation] 統計的声質変換に基づく食道音声強調における声質制御2011
- Author(s)
  山本憲三
- Organizer
  音声言語情報処理研究会
- Place of Presentation
  広島県福山市
- Year and Date
  2011-02-05

2010 Fiscal Year Annual Research Report

バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

Principal Investigator

戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)

Research Products

[Journal Article] Adaptive Voice-Quality Control Based on One-to-Many Eigenvoice Conversion2010

Author(s)

Journal Title

[Journal Article] Linear Transformation Approaches to Many-to-One Voice Conversion2010

Author(s)

Journal Title

[Presentation] 残差波形の使用による肉伝導音声変換処理の演算量削減2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声翻訳システムのための声質変換の性能評価2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 食道音声強調における声質制御技術の検討2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声翻訳システムのための声質変換法と日中英語間における評価2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 統計的声質変換に基づく食道音声強調における声質制御2011

Author(s)

Organizer

Place of Presentation

Year and Date

戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)