2005 Fiscal Year Annual Research Report
生成過程モデルに基づくコーパスベース韻律生成による任意の発話スタイルの音声合成
Project/Area Number |
17300055
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 大学院・情報理工学系研究科, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
峯松 信明 東京大学, 大学院・新領域創成科学研究科, 助教授 (90273333)
|
Keywords | 生成過程モデル / 基本周波数パターン / 種々の調子 / 自動推定 / 統計的手法 / 感情 / 音声コーパス / アクセント属性 |
Research Abstract |
音声コーパスから、その発話スタイルの音声合成を行う手法を確立するための研究を進め、以下の成果を達成した。 1.生成過程モデルの指令パラメータを、文から自動的に得られる言語情報等を入力とした2分木により推定する枠組みを確立し、詳細な解析を行った。 2.観測された基本周波数パターンから、統計的手法(2分木)により生成過程モデルの指令パラメータを自動推定する手法を開発し、発声の言語情報を入力に加えることで、学習音声話者以外の話者の音声の分析にも有効であることを示した。 3.声優(女性)1名が、ATR503文を、朗読及び怒り、喜び、悲しみの3種の感情で読み上げたものを収録した。感情音声については、文節毎に、話者が特に感情を込めたところをラベル付けした。音素ラベル付け、生成過程モデルに基づく韻律ラベル付けを行い、合成実験用音声コーパスとした。別のナレーター男女2名づつが朗読及び種々の調子(丁寧、ぞんざい、早口など)で発声したものも収録して、同様に処理し、音声コーパスとした。 4.上記1で開発した枠組みで、文節毎の感情の情報を入力に追加することにより、追加しない場合と比較して、より感情のこもった合成音声が得られることを、聴取実験により示した。音声合成はHMM音声合成法で行った。 5.単語のアクセント属性に基づき文節のアクセント型を決定する手法を開発した。アクセント属性として、従来のO型に代わりφ型を定義することにより、コンパクトな規則により、高い精度が得られることを示した。 6.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。
|
Research Products
(15 results)