研究課題
若手研究(B)
本研究では、高性能な声質変換の技術の改善について取り組んだ。声質変換とは、ある話者が発声した音声を他の人の声に変換する技術である。従来の声質変換では、音声特徴としてスペクトル情報(音色)や基本周波数(声の高さ、抑揚)などを独立に変換していたのに対し、提案手法では特徴量間の相関も考慮して、統一的に音声特徴を変換する枠組みを開発した。これにより、声質変換の性能が改善されることを示した。また、より少量の学習データで高性能な声質変換器を構築する手法を提案した。
音声情報処理