Research Project
Grant-in-Aid for Research Activity Start-up
音声合成システムを利用する際には,利用目的に応じた声質(話者らしさ)の選択が重要である.しかし従来手法では,声質は実在の話者に制約され,これを自在に制御することは難しい.本研究では,所望の声質でのテキスト音声合成を実現するため,プロンプト(声質を表現するテキスト)および視覚的インタフェースを通じて合成音声の声質を手軽に制御できる技術を開発する.構築した技術をWebインタフェースとして利用可能にし,合成音声の品質やユーザビリティなどの観点から本技術の有効性を多角的に評価する.