• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

音声の声道・声帯波・韻律特性を分離し連続変化させる柔らかな声質変換方式の開発

Research Project

Project/Area Number 22500145
Research InstitutionUniversity of Tsukuba

Principal Investigator

田中 和世  筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)

Co-Investigator(Kenkyū-buntansha) 三河 正彦  筑波大学, 大学院・図書館情報メディア研究科, 准教授 (40361357)
伊藤 慶明  岩手県立大学, ソフトウエア情報学部, 准教授 (90325928)
Keywords音声合成 / 音声分析 / 音声加工 / 声道断面積関数 / 韻律制御 / 音声モーフィング
Research Abstract

本研究では、音声の声道特性、声帯波特性、韻律を個別に制御する方式に基づく音声声質変換法を開発する。特に特徴パラメータ空間において連続的・面的に変換できる音声変換再合成技術を確立する。これを実現する具体的課題として以下の2項目について並列して研究を進めている。
(A)声道特性と声帯波特性、韻律の分離により、柔軟で連続的な声質の変換を可能とする音声変換手法の開発。
(B)韻律要素の数理モデルとパラメータ制御による連続的な変換を可能とする手法の開発。
今年度においては、項目(A)については、音声信号のAR-HMM分析による声道特性と声帯波特性を分離する声質変換手法の開発を進めた。ここで、声帯音源はケプストラム空間において写像関数を求めることにより変換した声帯音源波形を求め、声道特性については対数声道断面積関数空間での写像により変換を行う方式を採用した。特に、声道特性変換方式について、元話者と目標話者間の声道長の違いを克服する写像方式を開発した。これにより、両話者間での連続的な変換率に対応して声質が変化する変換手法を確立し、従来方式に対し優位にあることを確認した。
項目(B)については、従来は声質変換におけるピッチ変換に対しては文単位の平均的パターンの移動であったものを、本研究では、単語などより細かい単位でのピッチの変換手法について検討し、英文音声を対象としてその有効性を検証し、有効であることを確認した。
以上の研究成果は、オリジナリティの高い研究として評価を受けており、音声情報処理分野の主要国際会議や論文誌に発表掲載されている。

  • Research Products

    (7 results)

All 2011 2010 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] A Comparative Study of Focal Lengthening in the Speech of Native Speakers and Japanese Speakers of English2011

    • Author(s)
      Tomoka Nariai, Kazuyo Tanaka,Yoshiaki Itoh
    • Journal Title

      Acoustical Science and Technology

      Volume: 32 Pages: 54-61

    • Peer Reviewed
  • [Journal Article] A study of pitch patterns of sentence utterances by Japane sespeakers of English in comparison with native speakers of English2010

    • Author(s)
      Tomoko Nariai, Kazuyo Tanaka
    • Journal Title

      Proceedings of Interspeech Satellite Workshop : Second Language Studies

      Volume: 1 Pages: 4

    • Peer Reviewed
  • [Journal Article] Flexible Voice Morphing based on Linear Combination of Multi-speakers' Vocal Tract Area Functions2010

    • Author(s)
      Yosiki Nambu, Masahiko Mikawa, Kazuyo Tanaka
    • Journal Title

      Proceedings of 18th European Signal Processing Conference (EUSIPCO)

      Volume: 1 Pages: 790-794

    • Peer Reviewed
  • [Presentation] 声道特性から分離した音源特性の異なりを考慮した声質変換手法の検討2011

    • Author(s)
      南部良季, 三河正彦, 田中和世
    • Organizer
      日本音響学会2011年春季研究発表会
    • Place of Presentation
      早稲田大学
    • Year and Date
      2011-03-09
  • [Presentation] 日本人の英語文発声におけるパワーパターンの解析2010

    • Author(s)
      成合智子, 田中和世
    • Organizer
      日本音響学会2010年秋季研究発表会
    • Place of Presentation
      関西大学
    • Year and Date
      2010-09-15
  • [Presentation] 複数話者間における声道長の差異に着目した音声モーフィング手法の検討2010

    • Author(s)
      南部良季, 三河正彦, 田中和世
    • Organizer
      日本音響学会2010年秋季研究発表会
    • Place of Presentation
      関西大学
    • Year and Date
      2010-09-14
  • [Remarks]

    • URL

      http://www.slis.tsukuba.ac.jp/~ktanaka/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi