• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

任意のユーザーを対象とする統計的声質変換・制御法に関する研究

Research Project

Project/Area Number 18680018
Research InstitutionNara Institute of Science and Technology

Principal Investigator

戸田 智基  Nara Institute of Science and Technology, 情報科学研究科, 助教 (90403328)

Keywords音声情報処理 / 音声信号処理 / 音声合成 / 声質変換 / 声質制御 / 音韻性 / 話者性 / 固有声
Research Abstract

声質変換は、入力音声の言語情報を保つたまま話者性等の非言語情報を変換する技術である。前年度までに、従来の特定話者ペアに対する変換方式とは大きく異なる枠組みとして、任意の話者の声を特定の話者の声へと変換する多対一変換方式と、特定の話者の声を任意の話者の声へと変換する一対多変換方式を提案した。本年度は、多対一変換方式の適応データ量に対する頑健性を向上させるために、話者正規化学習法と最大事後確率推定に基づく固有声変換法を提案し、その有効性を評価した。その結果、約0.3秒といった極少量の発声を適応データとして用いた際においても、高い性能を持つ変換モデルを構築できることを示した(実施項目1に相当)。また、一対多声質変換方式において、声質表現語に基づく変換音声の声質手動制御を実現するために、重回帰混合正規分布モデルに基づく声質変換・制御法を提案し、その有効性を示した(実施項目2に相当)。さらに性能を改善する手法も提案し、その有効性を示した(項目外)。これらの研究と平行して、多対多声質変換法に関する検討も進めた(実施項目3に相当)。
声質変換の応用例として、肉伝導音声の品質改善、携帯電話音声の帯域拡張、発声障害者補助などを想定し、提案法の適用及び評価を行うための音声データ収録を行った(実施項目4に相当)。さらに、各応用例において、本研究課題で開発している声質変換法の基礎アルゴリズムの性能評価を行い、その高い有効性を確認した(項目外)。
以上の研究成果をまとめ、論文及び国際会議等で研究発表を行った。

  • Research Products

    (23 results)

All 2008 2007

All Journal Article (9 results) (of which Peer Reviewed: 9 results) Presentation (14 results)

  • [Journal Article] Bandwidth Extension of Cellular Phone Speech Based on Maximum Likelihood Estimation with GMM2008

    • Author(s)
      Wataru Fujitsuru
    • Journal Title

      Proceeding of NCSP (CD-ROM)

    • Peer Reviewed
  • [Journal Article] A Speech Parameter Generation Algorithm Considering Global Variance for HMM-Based Speech Synthesis2007

    • Author(s)
      Tomoki Toda
    • Journal Title

      IEICE Transactions on Information and Systems E90-D

      Pages: 816-824

    • Peer Reviewed
  • [Journal Article] Voice Conversion Based on Maximum Likelihood Estimation of Spectral Parameter Trajectory2007

    • Author(s)
      Tomoki Toda
    • Journal Title

      IEEE Transactions on Audio, Speech, and Language Processing 18

      Pages: 2222-2235

    • Peer Reviewed
  • [Journal Article] Statistical Mapping between Articiilatory Movements and Acoustic Spectrum Using a Gaussian Mixture Model2007

    • Author(s)
      Tomoki Toda
    • Journal Title

      Speech Communication 50

      Pages: 215-227

    • Peer Reviewed
  • [Journal Article] One-to-Many and Many-to-One Voice Conversion Based on Eigenvoices2007

    • Author(s)
      Tomoki Toda
    • Journal Title

      Proceeding of ICASSP (CD-ROM)

    • Peer Reviewed
  • [Journal Article] Regression Approaches to Voice Quality Control Based on One-to-Many Eigenvoice Conversion2007

    • Author(s)
      Kumi Ohta
    • Journal Title

      Proceeding of SSW6 (CD-ROM)

      Pages: 101-106

    • Peer Reviewed
  • [Journal Article] An Evaluation of Many-to-One Voice Conversion Algorithms with Pre-Stored Speaker Data Sets2007

    • Author(s)
      Daisuke Tani
    • Journal Title

      Proceeding of SSW6 (CD-ROM)

      Pages: 107-112

    • Peer Reviewed
  • [Journal Article] Speaker Adaptive Training for One-to-Many Eigenvoice Conversion Based on Gaussian Mixture Model2007

    • Author(s)
      Yamato Ohtani
    • Journal Title

      Proceeding of Interspeech2007-EUROSPEECH (CD-ROM)

      Pages: 1981-1984

    • Peer Reviewed
  • [Journal Article] Impact of Various Small Sound Source Signals on Voice Conversion Accuracy in Speech Sommunication2007

    • Author(s)
      Keigo Nakamura
    • Journal Title

      Proceeding of Interspeech2007-EUROSPEECH (CD-ROM)

      Pages: 2517-2520

    • Peer Reviewed
  • [Presentation] 適応データ量に頑健な多対一固有声変換法2008

    • Author(s)
      谷 大輔
    • Organizer
      日本音響学会春季研究発表会講演論文集
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-19
  • [Presentation] 一対多固有声変換に基づく声質制御法の拡張2008

    • Author(s)
      太田 久美
    • Organizer
      日本音響学会春季研究発表会講演論文集
    • Place of Presentation
      千葉
    • Year and Date
      2008-03-18
  • [Presentation] 微弱振動子とNAMマイクを用いた発話障害者補助2008

    • Author(s)
      中村 圭吾
    • Organizer
      情報処理学会全国大会講演論文集
    • Place of Presentation
      茨城
    • Year and Date
      2008-03-14
  • [Presentation] 固有声に基づく高品質一対多声質変換2007

    • Author(s)
      大谷 大和
    • Organizer
      音響学会関西支部第10回若手研究者交流研究発表会
    • Place of Presentation
      兵庫
    • Year and Date
      2007-11-29
  • [Presentation] 統計的声質変換を応用した人工音声の自然性改善に関する検討2007

    • Author(s)
      中村 圭吾
    • Organizer
      音響学会関西支部第10回若手研究者交流研究発表会
    • Place of Presentation
      兵庫
    • Year and Date
      2007-11-29
  • [Presentation] 事前収録話者データを用いた多対一声質変換法2007

    • Author(s)
      谷 大輔
    • Organizer
      電子情報通信学会音声研究会技術報告
    • Place of Presentation
      長崎
    • Year and Date
      2007-10-26
  • [Presentation] 一対多固有声変換に基づく声質制御法の評価2007

    • Author(s)
      太田 久美
    • Organizer
      電子情報通信学会音声研究会技術報告
    • Place of Presentation
      長崎
    • Year and Date
      2007-10-26
  • [Presentation] 一対多固有声変換に基づく声質制御法に関する予備的検討2007

    • Author(s)
      太田 久美
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Place of Presentation
      山梨
    • Year and Date
      2007-09-19
  • [Presentation] 話者選択及び固有声に基づく多対一声質変換法とその評価2007

    • Author(s)
      谷 大輔
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Place of Presentation
      山梨
    • Year and Date
      2007-09-19
  • [Presentation] 微弱音源を用いた喉頭摘出者音声から健常者ささやき声への声質変換の評価2007

    • Author(s)
      中村 圭吾
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Place of Presentation
      山梨
    • Year and Date
      2007-09-19
  • [Presentation] 広帯域符号化方式との比較による最尤変換法に基づく帯域拡張の評価2007

    • Author(s)
      藤敦 渉
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Place of Presentation
      山梨
    • Year and Date
      2007-09-19
  • [Presentation] 喉頭摘出者データを用いた人工音声変換システムの評価2007

    • Author(s)
      中村 圭吾
    • Organizer
      電子情報通信学会福祉情報工学研究会技術報告
    • Place of Presentation
      東京
    • Year and Date
      2007-08-03
  • [Presentation] 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討2007

    • Author(s)
      中村 圭吾
    • Organizer
      電子情報通信学会音声研究会技術報告
    • Place of Presentation
      富山
    • Year and Date
      2007-07-27
  • [Presentation] GMMに基づく最尤変換法による携帯電話音声の帯域拡張2007

    • Author(s)
      藤敦 渉
    • Organizer
      情報処理学会音声言語情報処理研究会研究報告
    • Place of Presentation
      宮城
    • Year and Date
      2007-07-21

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi