研究課題
若手研究(B)
本課題では、従来のテキスト音声合成に含まれるヒューリスティックに用いられてきた処理を取り除き、Deep Neural Networkを用いた音声波形のダイレクトモデリング手法に基づくテキスト音声合成の実現を目的とする。ヒューリスティックな処理を除いた単純な窓掛とフーリエ変換を用いて得られたスペクトルのモデル化、位相情報も含めたスペクトルのモデル化、スペクトル誤差を用いた音声波形のモデル学習を検討し、音声波形のダイレクトモデリング手法を実現した。
音声情報処理
音声インターフェースの核となる技術であるテキスト音声合成の性能改善のため、Deep Neural Networkを用いた音声波形モデリングが盛んに研究されている。本課題では、非常に注目されているこの研究トピックについて取り組み、テキスト音声合成の性能改善を行った。テキスト音声合成を用いる既存のシステムの性能改善,性能改善に伴う応用アプリの普及等多くの波及効果を期待できる。