電子書籍には音声合成機能が搭載され、ユーザは電子書籍を読んで楽しむだけでなく、聞いて楽しむことも出来る。この技術に、様々な声質や発話様式による音声生成が可能な統計的音声合成を組み合わせれば、合成音声の表現をユーザ自身がインタラクティブに制御可能なプラットフォームに変わる。 この目的のため、本研究では音響モデリング技術を音声の変換関数を因子化することで高度化させた。話者の変換行列と感情の変換行列を明示的に因子化させ、ある話者から推定された感情の変換行列を、全く別の話者においても利用できる適応アルゴリズムを提案した。また話者の性別や年齢を因子化したシステムも構築した。提案オーディオブックも試作した。
|