研究課題
挑戦的研究(開拓)
深層学習の導入によりテキスト音声合成の品質が向上し、更には感情表現等の多様な発話スタイルの実現も容易となってきた。しかし、生成したい音声の発話スタイルを指定するインタフェースをどのように構成するかという新たな問題が浮上してきている。本研究では、画像生成AIのプロンプティングに着想を得て、声優に指示するように自然な言葉で発話スタイル等を指示できる音声合成システムを構築することを目指す。