研究概要 |
コーパスベース韻律制御における強調手法を開発するとともに,開発した韻律制御手法を基に発話スタイルの制御が柔軟に行い得るテキスト音声合成システムを開発した。番組案内システムに実装して,その有効性を確認した。達成した個々の成果を以下に示す。 1.種々の位置の文節に発話焦点が置かれた音声を収録,分析し,焦点が置かれた文節に,フレーズ指令が生起することを示した。次に,焦点を置いた発声の,特に置かない発声(基準発声)からのフレーズ指令,アクセント指令の差分を,アクセント型,文中の位置,及び基準発声の指令等を入力として推定する2分木を構築した。既に,テキストから生成過程モデルの指令の位置と大きさを推定し,基本周波数パターンを生成する手法を開発しているが,これに,差分を適用することにより,焦点制御を良好に行い得ることを示した。この方法は,基準発声の基本周波数パターンを生成した上で,焦点を置いた発声の基本周波数パターンに変更する2段階の手法であるが,両段階で用いる学習コーパスの話者は同一である必要がなく,2段目の学習コーパスは少量でよいという特徴を有する。 2.フレーズ成分をルールベース,アクセント成分をコーパスベースで生成する柔軟な基本周波数パターン生成手法を中国語音声について開発し,焦点制御等をルールベースで行い得ることを示した。 3.上記1,2で開発した手法とHMM音声合成を組み合わせた日本語,中国語音声合成システムを構築し,HMM音声合成の韻律制御よりも,自然性の高い合成音声が得られることを示した。 4.音素HMMの適応と,基本周波数パターンの2段階処理により,任意の話者の朗読調音声から,任意の発話スタイルの音声を合成する手法を開発した。実際に,番組案内音声対話システムを構築し,ユーザの特徴や状況によって応答音声の発話スタイルを制御することを行い,開発した手法の有効性を実証した。
|