研究概要 |
従来の音声合成手法では実現することの難しかった多様な音声の合成を可能とする音声合成システムを,隠れマルコフモデル(HMM)に基づいて実現することを目的として研究を行い,以下の成果が得られた。 1.HMMによる音韻情報と韻律情報のモデル化:多空間上の確率分布に基づいたHMM(MSD-HMM)の概念を導入することにより,特別な仮定なしにピッチパターンをHMMにより直接モデル化する手法を開発し,スペクトル,ピッチ,継続長をHMMの枠組みで統一的に同時モデル化する手法を確立した。 2.HMMからのパラメータ生成:動的特徴量を考慮したHMMからのスペクトルパラメータ系列生成法を一般化し,状態系列あるいはその一部を非可観測としたまま尤度を最大にするアルゴリズムを開発し,HMMからのパラメータ生成法を確立した。また,韻律情報についても,MSD-HMMに基づいてピッチパターンを生成する手法を開発した。 3.HMMに基づくテキスト音声合成システムの実現:テキスト解析部として,品詞に基づいたNクラスモデルを利用した統計的形態素解析器とEDR辞書及び規則に基づくアクセント付与システムを構築し,上記HMMによる音韻・韻律情報のモデル化及びHMMからのパラメータ生成法に基づいて音声合成部を構成することにより,ワークステーションやパソコンで動作するテキスト音声合成システムを実現した。 4.多様な声質による音声合成:実現したHMM音声合成システムにおいて,音声合成単位HMMを話者適応することにより,合成音声の声質を他の話者の声質に変換する手法を開発した。さらに,任意の異なる話者間の声質を補間する手法も開発し,これらの手法により多様な声質による音声合成が実現可能なことを示した。
|