研究課題
研究代表者等が日本語について開発した基本周波数(F_0)パターンの生成過程のモデルを声調言語である中国語に拡張した上で、F_0パターンの自動分析手法を開発するとともに、標準語のみならず発話人口の多い、広東語、上海語について、F_0パターンの分析を行って韻律の合成規則を開発することを目的として以下の成果を達成した。1.標準中国語文音声について、発話内容既知の条件下で、生成過程のモデルのパラメータを自動的に抽出する手法を開発した。この手法は、基本的にF_0パターンの一次微係数の極値から声調指令を推定するものであるが、発話内容から予想される声調指令を利用することにより、大幅な推定精度の向上が可能なことを、2名の話者の80文音声について示した。2.標準語の分析結果を基に、広東語の各声調について、生成過程のモデルの声調指令の形状を設定した。男女3名の話者の文音声を収集し、モデルのよる分析を行い、形状設定の妥当性を確認した。音節と指令の時間関係について分析した結果は標準語について得られた結果と整合性のあるものであった。分析結果から構築した簡単な規則により原音声に近いF_0パターンが得られることを示した。3.上記2と同様の研究を上海語についても行い、生成過程のモデルのF_0パターン声調指令の形状を設定し、その妥当性を確認した。また、基本的に、上海語では先頭音節の声調で単語全体のパターンが規定されることを明確にした。4.標準語について、声調の特徴が明確に現われる音調核に着目したF_0パターン合成手法を開発した。これは、テキスト情報から、コーパスベース手法により各音節の音調核F_0パターンを生成し、それを接続することにより文全体のF_0パターンを合成するものである。5.音節毎にそのF_0のピーク位置を推定してパターンを生成し、接続して文音声のF_0パターンを合成する手法を開発した。
すべて 2005 2004
すべて 雑誌論文 (14件)
日本音響学会講演論文集 1
ページ: 173-174
ページ: 301-302
Proc. IEEE International Conference on Acoustics, Speech, & Signal Processing (発表予定)
Speech Communication (Special Issue on Quantitative prosody modeling for natural speech description and generation) (発表予定)
IEICE Trans.Information and Systems (Special Issue on Speech Dynamics by Ear, Eye, Mouth and Machine) E87-D・5
ページ: 1079-1085
Proc. IEEE International Conference on Acoustics, Speech, & Signal Processing 1
ページ: 913-916
Proc. 5^<th> ISCA Speech Synthesis Workshop
ページ: 227-228
Proc. International Conference on Signal Processing
ページ: 655-658
ページ: 393-394
ページ: 395-396
Proc. 8^<th> International Conference on Spoken Language Processing 1
ページ: 749-752
ページ: 781-784
Proc. International Symposium on Chinese Spoken Language Processing
ページ: 81-84
ページ: 185-188