2010 Fiscal Year Annual Research Report
音声の声道・声帯波・韻律特性を分離し連続変化させる柔らかな声質変換方式の開発
Project/Area Number |
22500145
|
Research Institution | University of Tsukuba |
Principal Investigator |
田中 和世 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)
|
Co-Investigator(Kenkyū-buntansha) |
三河 正彦 筑波大学, 大学院・図書館情報メディア研究科, 准教授 (40361357)
伊藤 慶明 岩手県立大学, ソフトウエア情報学部, 准教授 (90325928)
|
Keywords | 音声合成 / 音声分析 / 音声加工 / 声道断面積関数 / 韻律制御 / 音声モーフィング |
Research Abstract |
本研究では、音声の声道特性、声帯波特性、韻律を個別に制御する方式に基づく音声声質変換法を開発する。特に特徴パラメータ空間において連続的・面的に変換できる音声変換再合成技術を確立する。これを実現する具体的課題として以下の2項目について並列して研究を進めている。 (A)声道特性と声帯波特性、韻律の分離により、柔軟で連続的な声質の変換を可能とする音声変換手法の開発。 (B)韻律要素の数理モデルとパラメータ制御による連続的な変換を可能とする手法の開発。 今年度においては、項目(A)については、音声信号のAR-HMM分析による声道特性と声帯波特性を分離する声質変換手法の開発を進めた。ここで、声帯音源はケプストラム空間において写像関数を求めることにより変換した声帯音源波形を求め、声道特性については対数声道断面積関数空間での写像により変換を行う方式を採用した。特に、声道特性変換方式について、元話者と目標話者間の声道長の違いを克服する写像方式を開発した。これにより、両話者間での連続的な変換率に対応して声質が変化する変換手法を確立し、従来方式に対し優位にあることを確認した。 項目(B)については、従来は声質変換におけるピッチ変換に対しては文単位の平均的パターンの移動であったものを、本研究では、単語などより細かい単位でのピッチの変換手法について検討し、英文音声を対象としてその有効性を検証し、有効であることを確認した。 以上の研究成果は、オリジナリティの高い研究として評価を受けており、音声情報処理分野の主要国際会議や論文誌に発表掲載されている。
|