2011 Fiscal Year Annual Research Report
音声の声道・声帯波・韻律特性を分離し連続変化させる柔らかな声質変換方式の開発
Project/Area Number |
22500145
|
Research Institution | University of Tsukuba |
Principal Investigator |
田中 和世 筑波大学, 図書館情報メディア系, 教授 (70344207)
|
Co-Investigator(Kenkyū-buntansha) |
三河 正彦 筑波大学, 図書館情報メディア系, 准教授 (40361357)
伊藤 慶明 岩手県立大学, ソフトウエア情報学, 准教授 (90325928)
|
Keywords | 音声合成 / 音声分析 / 音声モーフィング / 韻律変換 / 声道断面積関数 / 離散コサイン変換 |
Research Abstract |
本研究では、音声の声道特性、声帯波特性、韻律を個別に制御する方式に基づく音声声質変換法を開発する。特に声道特性について声道断面積関数を特徴パラメータとすることにより、特徴空間において従来は点から点への変換であったものを連続的・面的に変換できる柔軟な音声変換再合成技術を確立する。また、韻律要素の数理モデルとパラメータ制御による連続的な変換を可能とする手法を開発する。 今年度においては、声道断面積関数を導出するための計算法について、一旦、推定されたパワースペクトルに制約をつけて、声道断面積関数領域へ変換する計算量の少ない手法開発を進めている。 韻律特徴の変換については、韻律変換の適用対象の一つとして、日本語母語話者の英語発話音声に着目し、前年度までの基本周波数パターンに加え、パワーパターン、単語発話持続時間についての特徴分析を行い、その特徴を明らかにした。将来的には、語学学習システムへの適用が考えられる。 また、全過程の自動処理が可能な韻律変換手法として、韻律特徴時系列パターンの離散コサイン変換(DCT)による特徴パラメータ化に基づく変換手法を開発した。従来の手法は基本周波数パターンの平均値に基づく平行移動に過ぎなかったため、話調(発話スタイル)の変換などは基本的に困難であった。本手法によれば、基本周波数やパワーパターンの局所的な変化を表現でき、その写像を行うことにより発話スタイルの変換が可能となる。今回は、中立的な発話スタイルから感情の入った発話スタイルへの変換を試みて、聴取実験によりその効果を確認した(学会発表準備中)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
声道断面積関数を特徴空間とする統計的写像に基づく手法開発は当初の計画に沿って順調に進み、その効果は検証されている。韻律の変換についても「実績の概要」の項に述べたように、新手法を開発中であり進展が望める。
|
Strategy for Future Research Activity |
来年度は、各手法のリファインとともに、声道特性の変換と韻律特徴の変換の両手法を組み込んだ全体システムの開発が課題である。
|
Research Products
(5 results)