研究課題/領域番号 |
18300063
|
研究機関 | 早稲田大学 |
研究代表者 |
匂坂 芳典 早稲田大学, 大学院国際情報通信研究科, 教授 (70339737)
|
研究分担者 |
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
誉田 雅彰 早稲田大学, スポーツ科学学術院, 教授 (90367095)
|
キーワード | 音声合成 / 韻律制御 / 対話音声 / イントネーション / 基本周波数 |
研究概要 |
本年度は、対話音声を合成するために必要な、対話音声の韻律出力自由度の規定および、それに必要な入力情報の規定を進めた。我々は既に一語発話「ん」が有する声帯の基本周波数(FO)特性とその聴覚印象の分析を通じ、両者に深い関連があることを明らかにしている。多次元尺度構成法(MDS)を利用した分析の結果、発話印象は3次元(確信・疑念、肯定・否定、好印象・悪印象)によって近似的に記述できることが分かり、韻律制御との対応が明らかとなった。「確信・疑念」、「肯定・否定」に対応する印象はF0の時間変化形状を現す4種のダイナミックパタン(上昇、平坦、下降、上昇後下降)とよく呼応し、「好印象・悪印象」に対応する印象は基本周波数F0の高さに反映される事が判明した。この実験事実に基づき、語彙が有する印象情報を利用した韻律生成法を新たに提案した。この対話韻律生成法では、入力語彙自身が与える印象から抽出した韻律属性を用い、従前からの制御として得られる韻律制御パラメータの変形を行う。対話韻律生成の制御変数として新たに印象ベクトル表現を導入し、出力語彙から想起される発話状況にデフォルトの韻律を推定、生成する。 提案した対話韻律生成法の妥当性を確認するため、合成音声を作成し、聴取実験を行った。提案する合成方法では、生成過程のモデルとしてよく知られたF0指令応答モデルを用い、種々の印象に対応する「ん」のF0時間変化パタン特性を合成対象とする各単文節音声のF0生成に加えることにより、対話F0パタンを合成する。提案した対話韻律生成法の有効性を評価するため、得られた対話F0パタンによるSTRAGHT合成音の自然性評価試験を行い、提案法の有効性が確認できた。
|