研究課題
基盤研究(B)
基本周波数パターン生成過程のモデルを前提とし、コーパスベース手法により、任意の発話スタイルの音声を高品質に合成しうる音声合成手法を確立することを目的として研究を進めた結果、以下の成果をあげ、当初の計画を達成した。1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定し、それによって基本周波数パターンを合成する手法を開発した。休止の位置と長さ、音素の長さを2分木により推定する手法と統合し、韻律制御手法を確立した。感情音声を始めとする種々のスタイルの音声合成を行って、手法の有効性を確認した。観測される基本周波数パターンについて、指令パラメータを2文木により自動的に抽出する手法を開発し、テキストの言語情報を入力とすることで、抽出精度が向上することを示した。2.焦点を置いた発声の、特に置かない発声(基準発声)からのフレーズ指令、アクセント指令の差分を、アクセント型、文中の位置、及び基準発声の指令等を入力として推定する2分木を構築した。上記1に差分を適用することにより、焦点制御を良好に行い得ることを示した。3.フレーズ成分をルールベース、声調成分をコーパスベースで生成する2段階処理の柔軟な基本周波数パターン生成手法を中国語音声について開発し、焦点制御等をルールベースで行い得ることを示した。4.上記1,2で開発した手法とHMM音声合成を組み合わせた日本語・中国語音声合成システムを構築し、HMM音声合成の韻律制御よりも、自然性の高い合成音声が得られることを示した。また、種々の発話スタイルの合成音声が得られることを示した。5.上記音声合成システムを用いた道案内音声対話システム、番組案内音声対話システムを構築し、ユーザの特徴や状況によって応答音声の発話スタイルを制御することを行い、開発した音声合成手法の有効性を実証した。
すべて 2008 2007 2006 2005
すべて 雑誌論文 (20件) (うち査読あり 7件) 学会発表 (5件) 図書 (2件)
Journal of Signal Processing 12
ページ: 7-16
Proceedings of International Conference on Speech Prosody 1
ページ: 95-98
Journal of Signal Processing Vol.12, No.1
Proceedings of International Conference on Speech Prosody, Campinas Vol.1
情報処理学会論文誌 48
ページ: 3300-3308
Archives of Acoustics 32
ページ: 41-50
IPSJ (Information Processing Society of Japan) Journal vol.48, no.9
Archives of Acoustics Vol.32, No.1
Speech Communication 48
ページ: 989-1008
Journal of Acoustical Society of America 119
ページ: 1764-1782
Proceedings Interspeech 2006 1
ページ: 305-308
Speech Communication Vol.48, No.8
Journal of Acoustical Society of America Vol.119, No.3
Proceedings Interspeech 2006, Pittsburgh Vol.1
ページ: 385-404
Proceedings Inerspeech 2005 1
ページ: 3257-3260
Speech Communication Vol.46, Nos.3-4
Proceedings Inerspeech 2005, Lisbon Vol.1
Prosody in spoken language information processing -Science of accent, intonation, and rhythm- (218 pages), Edited by K. Hirose, Maruzen
ページ: 109-118
Spoken Language Systems (347 pages), Edited by S. Nakagawa, M. Okada, and T. Kawahara, Ohm-sha
ページ: 73-86