研究課題/領域番号 |
17300063
|
研究機関 | 名古屋工業大学 |
研究代表者 |
徳田 恵一 名古屋工業大学, 大学院・工学研究科, 教授 (20217483)
|
研究分担者 |
北村 正 名古屋工業大学, 大学院・工学研究科, 教授 (60114865)
南角 吉彦 名古屋工業大学, 大学院工学研究科, 助手 (80397497)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90403328)
|
キーワード | 音声合成 / 隠れマルコフモデル / 歌声合成 / 発話スタイル / 感情音声 / メディアコンテンツ |
研究概要 |
デジタルメディア作品の制作を支援する音声合成として、作品の制作者が必要とする声質、スタイルの高品質な合成音声を自由に生成し得る技術を開発するのが本研究の目的である。これは市販されているようなテキスト音声合成では実現不可能であり、本研究では、種々の声質、スタイルの音声を少量の音声データから作成する"柔軟な"音声合成技術を開発する。音声のみに止まらず、歌声についても研究対象とする。 これまでに、音素HMMを接続し、出力確率が最大となる音響パラメータの時系列を生成して音声合成を行うHMM音声合成方式を確立しているが、HMMを新しい話者、新しい発話スタイル等に適応させることにより、それらの音声を合成すること目的として研究を進めた。また、これまでに開発した音源モデル化手法を発展させ、自然音声から高精度で肉声感の高い音声の生成を可能とする手法を提案、呼びシステムを構築した。 本年度の具体的実績は以下の通りである。 (1)本研究を通して利用する実験用の音声データを収録した。 (2)これまでに開発した韻律・言語情報編集ツールを用いて、収録した音声にラベ付けを行なった。 (3)これまでに開発したHMM音声合成ソフトウェアツールキットにより、モデルの学習を行い、データおよびラベルのチェックを行なった。 (4)並行して、励振源モデルの理論的整備と予備実験を行なった。
|