人間が発声する音声を模倣するシステムによる音声符号化を構築することを目的として、研究を行ってきた。基本的な音声模倣の原理として、音声合成器を出力に用い、この音声合成器に、入力音声を模倣させるようなアルゴリズムを考案し、評価を行った。音声合成器としては音声を短区間で切り出した波形素片をつなげて音声合成を行う方式のものを採用し、入力音声を模倣するために最適な素片を選択するためのアルゴリズムを開発した。音声合成用素片を発話した話者と、入力音声の話者は一般に異なるため、単純に音響特徴パラメータによりパタンマッチングするだけでは、自然な模倣音声を出力することができない。そのため、本年度の研究においては、素片を発話した話者の母音特徴量と入力音声話者の母音特徴量を、日本語5母音ごとに対応付けを行い、特徴パラメータ空間内において適応的に座標変換を行い、これにより、入力話者を素片を発話した話者に話者適応した後に、音声模倣を行うアルゴリズムを提案した。この話者適応法を母音マッチング法と命名し、これを適用した場合とそうでない場合とで模倣後の合成音声の音質評価を主観評価により行った。音声合成器の話者は女性1名で固定であるが、入力話者として男女10名の発話した文章を用いて音質評価実験を行ったところ、入力話者が男性の場合には、、模倣音声に顕著な音質改善効果が見られた。一方、入力話者が女性の場合には、音質の改善はみられなかった。このことから、この話者適応法は性差がある場合の音声模倣に有効であることが分かった。
|