研究概要 |
本研究は,話速を変えた場合の調音運動データの収集・評価を通して,話速変換が可能で自然性の高い合成音声が生成できるシステムを実現することを目的とする. 本年度の実験では,縦続1次系関数を調音運動の表現に利用し運動をパラメータ表現し,パラメータ化された運動パターンを統合することで,発話時の舌面の形状を再現した.運動がパラメータ化されることで,異なる調音データ収集セッションから得られたデータの統合も可能となり,運動の詳細をとらえることが可能になった.また,これらのパラメータ変化を調べることで,被験者による運動様態の違いなどが定量的に把握できるようになった. 研究では,昨年度までに作成した定常母音の音声合成システムをベースに,連続調音に対応した音声合成システムの作成も並行して行った.MRIからのスタティックな声道形状データをベースに,縦続1次系関数により母音遷移形状を補間することで,連続調音におけるダイナミックな運動パターンを表現した.この形状変化を音声合成部へ送ることで,連続性の良好な合成音を作成することができた.この合成システムはGUIベースのシステムとなっており,インタラクティブに調音と音響特性の検討が可能でもある.MRIデータでは,声帯付近と口唇部において声道断面積の抽出が容易ではないが,このシステムを用いることで断面積変化が音響特性に与える影響を確認でき,より信頼性の高い声道断面積の抽出も可能となった.また,ダイナミツクな形状変化をより効果的にとらえることができるよう,声道形状の3次元アニメーション機能を実現した.
|