表現力豊かな歌唱音声合成手法の探求を目的として、隠れマルコフモデル(HMM)に基づいた歌唱合成の研究を進めている。この技術は、与えられた任意の歌唱曲の楽譜から自動的に歌声音声を合成する用途だけでなく、コンテンツ制作支援という側面においても寄与するものである。本年度では、前年までに収録した女性1名、著作権の失効した楽曲60曲を対象とした歌唱音声データベースの整備を継続して実施した。また、その歌唱データベースに基づいて、新たな女性歌唱者の歌唱合成モデルを構築し歌唱音声の多様化を進めた。別の実施項目として、歌唱音声を多様化する観点から、歌唱音声や通常の読み上げ音声における個人性の再現性・知覚について調査を行った。HMM歌唱合成の枠組みでは、モデルパラメータを柔軟に変更することで歌唱音声を加工することができる利点があるが、モデルを学習した歌唱データ提供者の本来の個人性が、変更後の歌唱音声においてどの程度保持されるかについて検討された事例はこれまでにない。そこで、歌唱合成モデルにおけるスペクトルと基本周波数を制御するパラメータを変更し、それによって歌唱者の本人らしさがどの程度維持されるかを、合成歌唱からの主観評価によって調査した。そのほか、歌唱合成の効果的なアプリケーションとして自動歌唱作曲システム「Orpehus」の開発を進めた。これは、任意のテキストやキーワードから生成された詞に沿ってメロディを作成し、それに合った歌唱音声を合成するものであり、この歌声合成エンジンには本研究の成果が利用されている。利用者は自分の要望に合わせて詩やメロディ、歌唱音声を得ることができ、リズムなど作曲スタイルの変更や歌声のカスタマイズなどを楽しむことができ、HMM歌声合成システムが有効に機能するアプリケーションである。
|