研究課題
音声コーパスから、その発話スタイルの音声合成を行う手法を確立するための研究を進め、以下の成果を達成した。1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定する枠組みを確立し、詳細な解析を行った。2.観測された基本周波数パターンから、統計的手法(2分木)により生成過程モデルの指令パラメータを自動推定する手法を開発し、発声の言語情報を入力に加えることで、学習音声話者以外の話者の音声の分析にも有効であることを示した。3.声優(女性)1名が、ATR503文を、朗読及び怒り、喜び、悲しみの3種の感情で読み上げたものを収録した。感情音声については、文節毎に、話者が特に感情を込めたところをラベル付けした。音素ラベル付け、生成過程モデルに基づく韻律ラベル付けを行い、合成実験用音声コーパスとした。別のナレーター男女2名づつが朗読及び種々の調子(丁寧、ぞんざい、早口など)で発声したものも収録して、同様に処理し、音声コーパスとした。4.上記1で開発した枠組みで、文節毎の感情の情報を入力に追加することにより、追加しない場合と比較して、より感情のこもった合成音声が得られることを、聴取実験により示した。音声合成はHMM音声合成法で行った。5.単語のアクセント属性に基づき文節のアクセント型を決定する手法を開発した。アクセント属性として、従来のO型に代わりφ型を定義することにより、コンパクトな規則により、高い精度が得られることを示した。6.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。
すべて 2006 2005
すべて 雑誌論文 (14件) 図書 (1件)
Spoken Language Systems (Ohm-sha)
ページ: 73-86
Speech Communication (発表予定)
Proc. International Conference on Speech Prosody 発表予定
日本音響学会講演論文集 CD-ROM
ページ: 279-282
ページ: 213-214
ページ: 387-388
電子情報通信学会技術研究報告(音声研究会) SP2005-159
ページ: 55-60
パートナーロボット資料集成(エヌ・ティー・エス) 2章1節
ページ: 58-67
Speech Communication 46・3-4
ページ: 385-404
Proc. 9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
ページ: 3257-3260
ページ: 3625-3628
ページ: 1397-1400
Proc. Speech Analysis, Synthesis and Recognition -Application of Phonetics- CD-ROM
ページ: 8 pages
ページ: 427-428