2008 年度実績報告書

任意のユーザーを対象とする統計的声質変換・制御法の構築に関する研究

研究課題

研究課題/領域番号	18680018
研究機関	奈良先端科学技術大学院大学
研究代表者	戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)
キーワード	音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / 音韻性 / 話者性 / 固有声
研究概要	前年度までに、任意の話者の声質を特定話者の声質へと変換する多対一声質変換法として、極少量の音声データを用いた教師無し適応法を提案し、また、特定話者の声質を任意の声質へと変換する一対多声質変換法として、声質制御機能と教師無し適応性能を兼ね備えた変換伝を提案した。今年度は、より柔軟性に優れた変換法として、固有声変換と参照話者に基づく多対多声質変換法を提案した(実施項目1に相当)。また、前年度に引き続き、声質変換技術を用いた様々なアプリケーションを想定し、通常音声、肉伝導音声、キャラクター音声などの収録を行い、データベースの構築を行った(実施項目2に相当)。本データベースを活用し、これまでに提案してきた声質変換法を、多対一変換ボイスチェンジャー、声質制御機能付き一対多変換ボイスチェンジャー、携帯電話音声の帯域拡張、肉伝導音声変換というアプリケーションへと適用した(実施項目3に相当)。これら各想定アプリケーションにおいて、声質変換法の評価を実験的に行い、その高い有効性を確認した(実施項目4に相当)。さらに、これらのアプリケーションの実環境での使用を想定し、実用性の改善に取り組んだ。人対人のコミュニケーションにおける使用では、リアルタイム変換処理や、限られたリソースでも動作するための演算量削減が重要となるため、高品質かつ低演算量で動作するリアルタイム声質変換処理を提案した。さらに.肉伝導音声変換においては、肉伝導マイクの圧着位置の違い等の収録環境変化によりもたらされる音響特性変動を補正するために、教師なし音響特性補正法を提案した。実験的評価により、これら提案法の有効性を確認した。

研究成果
(19件)

すべて 2009 2008

すべて雑誌論文 (7件) (うち査読あり 6件) 学会発表 (12件)

[雑誌論文] 音声合成/音声変換がもたらす新たなコミュニケーション-「伝達の円滑化」を生み出す声をつくる(解説)2009
- 著者名/発表者名
  戸田智基
- 雑誌名
  
  Mobile Society Review未来心理 15
  
  ページ: 6-15
[雑誌論文] STRAIGET混合励振源を用いた混合正規分布モデルに基づく最尤声質変換法2008
- 著者名/発表者名
  大谷大和
- 雑誌名
  
  電子情報通信学会論文誌 J91-D
  
  ページ: 1082-1091
- 査読あり
[雑誌論文] Low-Delay Voice Conversion based on Maximum Likelihood Estimation of Spectral Parameter Trajectory2008
- 著者名/発表者名
  Takashi Muramatsu
- 雑誌名
  
  Proceeding of Interspeech (CD-ROM)
  
  ページ: 1076-1079
- 査読あり
[雑誌論文] An Improved One-to-Many Eigenvoice Conversion System2008
- 著者名/発表者名
  Yamato Ohtani
- 雑誌名
  
  Proceeding of Interspeech (CD-ROM)
  
  ページ: 1080-1083
- 査読あり
[雑誌論文] Maximum A Posteriori Adaptation for Many-to-One Eigenvoice Conversion2008
- 著者名/発表者名
  Daisuke. Tani
- 雑誌名
  
  Proceeding of Interspeech (CD-ROM)
  
  ページ: 1461-1464
- 査読あり
[雑誌論文] Evaluation of Speaking-Aid System with Voice Conversion for Laryngectothees Toward Its Use in Practical Environments2008
- 著者名/発表者名
  Keigo Nakamura
- 雑誌名
  
  Proceeding of Interspeech (CD-ROM)
  
  ページ: 2209-2212
- 査読あり
[雑誌論文] Statistical Conversion of Speech Parameter Trajectory for Mapping between Features of Different Modalities (Invited Talk)2008
- 著者名/発表者名
  Tomoki Toda
- 雑誌名
  
  Proceeding of Acoustics'08 Paris (the 2nd ASA-EAA joint conference) 123
  
  ページ: 3938-3939
- 査読あり
[学会発表] 統計的手法に基づく電気式人工喉頭音声変換における出力音声の検討2009
- 著者名/発表者名
  中村圭吾
- 学会等名
  日本音響学会春季研究発表会講演論文集
- 発表場所
  東京
- 年月日
  2009-03-18
[学会発表] 共分散行列の対角化に基づく混合正規分布モデルを用いた声質変換処理の高速化2009
- 著者名/発表者名
  村松敬司
- 学会等名
  日本音響学会春季研究発表会講演論文集
- 発表場所
  東京
- 年月日
  2009-03-17
[学会発表] 肉伝導音声変換のための最尤基準による音響特性補正2009
- 著者名/発表者名
  宮本大輔
- 学会等名
  日本音響学会春季研究発表会講演論文集
- 発表場所
  東京
- 年月日
  2009-03-17
[学会発表] 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化2009
- 著者名/発表者名
  村松敬司
- 学会等名
  情報処理学会研究報告
- 発表場所
  新潟
- 年月日
  2009-02-07
[学会発表] 音響特性補正の導入による肉伝導音声変換の収録環境適応2009
- 著者名/発表者名
  宮本大輔
- 学会等名
  情報処理学会研究報告
- 発表場所
  新潟
- 年月日
  2009-02-06
[学会発表] 肉伝導音声変換のための音響特性補正法2009
- 著者名/発表者名
  宮本大輔
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  奈良
- 年月日
  2009-01-30
[学会発表] 任意の話者を対象とする統計的声質変換・制御法(招待講演)2009
- 著者名/発表者名
  戸田智基
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  奈良
- 年月日
  2009-01-30
[学会発表] 参照話者を用いた多対多固有声変換法2009
- 著者名/発表者名
  大谷大和
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  奈良
- 年月日
  2009-01-30
[学会発表] スペクトル系列の最尤推定に基づく短遅延声質変換法2009
- 著者名/発表者名
  村松敬司
- 学会等名
  電子情報通信学会音声研究会技術報告
- 発表場所
  奈良
- 年月日
  2009-01-30
[学会発表] 肉伝導音声変換における制約付き最尤線形回帰に基づく音響特性補正2008
- 著者名/発表者名
  宮本大輔
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  福岡
- 年月日
  2008-09-12
[学会発表] 最尤スペクトル系列変換に対する短遅延処理アルゴリズムの適用2008
- 著者名/発表者名
  村松敬司
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  福岡
- 年月日
  2008-09-12
[学会発表] 固有声変換のための話者正規化学習における初期モデルの検討2008
- 著者名/発表者名
  大谷大和
- 学会等名
  日本音響学会秋季研究発表会講演論文集
- 発表場所
  福岡
- 年月日
  2008-09-11

2008 年度 実績報告書

任意のユーザーを対象とする統計的声質変換・制御法の構築に関する研究

研究代表者

戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)

研究成果

[雑誌論文] 音声合成/音声変換がもたらす新たなコミュニケーション-「伝達の円滑化」を生み出す声をつくる(解説)2009

著者名/発表者名

雑誌名

[雑誌論文] STRAIGET混合励振源を用いた混合正規分布モデルに基づく最尤声質変換法2008

著者名/発表者名

雑誌名

[雑誌論文] Low-Delay Voice Conversion based on Maximum Likelihood Estimation of Spectral Parameter Trajectory2008

著者名/発表者名

雑誌名

[雑誌論文] An Improved One-to-Many Eigenvoice Conversion System2008

著者名/発表者名

雑誌名

[雑誌論文] Maximum A Posteriori Adaptation for Many-to-One Eigenvoice Conversion2008

著者名/発表者名

雑誌名

[雑誌論文] Evaluation of Speaking-Aid System with Voice Conversion for Laryngectothees Toward Its Use in Practical Environments2008

著者名/発表者名

雑誌名

[雑誌論文] Statistical Conversion of Speech Parameter Trajectory for Mapping between Features of Different Modalities (Invited Talk)2008

著者名/発表者名

雑誌名

[学会発表] 統計的手法に基づく電気式人工喉頭音声変換における出力音声の検討2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 共分散行列の対角化に基づく混合正規分布モデルを用いた声質変換処理の高速化2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 肉伝導音声変換のための最尤基準による音響特性補正2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音響特性補正の導入による肉伝導音声変換の収録環境適応2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 肉伝導音声変換のための音響特性補正法2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 任意の話者を対象とする統計的声質変換・制御法(招待講演)2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 参照話者を用いた多対多固有声変換法2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] スペクトル系列の最尤推定に基づく短遅延声質変換法2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 肉伝導音声変換における制約付き最尤線形回帰に基づく音響特性補正2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 最尤スペクトル系列変換に対する短遅延処理アルゴリズムの適用2008

著者名/発表者名

学会等名

発表場所

2008 年度実績報告書

戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)