研究概要 |
今年度は, 合成音声を用いた日本人英語音声のイントネーション評価を中心に研究を行った. まず, イントネーション評価のための教師音声として合成音声を用いることの有効性を検証した. 英語母語話者音声を教師音声とした場合と, 合成音声を教師音声とした場合について, システムによる評定がどの程度人間による評定と整合するかを相関関数により評価した. その結果, ユークリッド距離を用いた評定値計算を用いた場合には, 合成音による評定の信頼性は母語話者音声を用いる場合に比べて信頼性が低下した. しかし, 距離尺度としてマハラノビス距離を用い, また評価の重要度によって距離を重みづけすることにより, 合成音声を用いた評定でも母語話者音声と同等の信頼性が得られることがわかった. 次に, 評定値の計算方法について検討した. 従来法では, 学習者の音声のイントネーションパタンと最も近い教師音声のイントネーションパタンに対する距離のみによって評定値を計算していた. これに対し, 提案法では, 学習者と全ての教師音声との距離を用い, これらの距離の線形結合によって評定値を計算する. 線形結合の重みの最適化には重回帰分析を用いた. 実験の結果, 合成音を教師音声とした場合, 人間による評定との相関は0.203から0.288に増加した. さらに, イントネーション評定システムに対し, イントネーションのための特徴量だけでなく, リズム評価のための特徴量を導入することを検討した. その結果, 人間による評定との相関は0.36まで上昇した.
|