2012 Fiscal Year Annual Research Report
音声の声道・声帯波・韻律特性を分離し連続変化させる柔らかな声質変換方式の開発
Project/Area Number |
22500145
|
Research Institution | University of Tsukuba |
Principal Investigator |
田中 和世 筑波大学, 図書館情報メディア系, 教授 (70344207)
|
Co-Investigator(Kenkyū-buntansha) |
三河 正彦 筑波大学, 図書館情報メディア系, 准教授 (40361357)
伊藤 慶明 岩手県立大学, ソフトウェア情報学部, 准教授 (90325928)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 音声合成 / 話者モーフィング / 音声加工 / 声道断面積関数 / 韻律変換 |
Research Abstract |
本研究では、音声の声質変換手法において、声道特性と声帯波特性を分離することにより、声道特性である対数声道断面積関数を特徴パラメータとして変換を行う手法を開発する。この手法を基礎として、特徴空間において従来の声質変換は点から点への変換であったものを連続的・面的に変換できる柔軟な音声変換再合成技術を確立する。また、韻律要素の数理モデルとパラメータ制御による連続的な韻律特徴の変換を可能とする手法を開発する。 声道断面積関数と声帯波特性を用いた声質変換手法に関しては、前年度までに音韻性を保持した連続的な変換が可能であることを実証したが、今年度はより自然性の高い音質を得るために声道断面積関数の空間的・時間的連続性を考慮した改良を行い、この領域での変換手法を概ね確立した。 韻律変換に基づく声質変換手法として、前年度に引き続き韻律特徴時系列の離散コサイン変換による特徴パラメータ化に基づく変換手法の開発を進めた。本手法によれば、従来手法による声質変換では韻律の平均的レベルの変換に過ぎなかったものが基本周波数やパワーパターンの局所的な変化を表現でき、その写像を行うことにより発話スタイルの変換が可能となる。ただし、統計的変換に対するサンプル数を十分に集めるのは困難であり、ベクトル空間での次元間の相関は無しとする変換を行うなどの工夫が必要である。本手法の聴取実験による評価の過程で、パワーパターンが意図・感情などの特性を表す上で重要であることなど確認された。 韻律特徴の変換については、韻律特徴の数理的モデル化を目指す基礎研究として、日本語母語話者の英語発話音声についての基本周波数、パワーパターン、発話持続時間についての分析的研究を行い、今後の研究に有効な知見を明らかにした。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(5 results)