研究課題
若手研究(B)
本研究では、限られた音声資源のみで自然かつ高品質な音声を合成することを目的としており、本年度は以下の項目について成果が得られた。(1)評価および比較実験に必要な長時間音声データの収録準備:5時間程度の音声を収録するため、収録文を用意・作成した。作成には目標話者の話し方に応じたキャラクター依存文も用意した。これにより、従来の朗読調の文のみでなくキャラクターの個性をもった文を用いることでより個人性を向上できると期待できる。(2)提案法であるハイブリッド音声合成の理論的枠組:素片の正規化法について基本的な理論の構築を行った。具体的にはモデル適応の枠組みを利用し、線形変換により素片の音声パラメータを変換することで素片間のばらつきが低減できると期待される。(3)ハイブリッド音声合成の予備的検討:少量の音声データについて予備的な実験を行い、動作を確認した。(4)音声の多様化手法の検討:関連研究として、音声および歌声におけるスタイルや言語の多様化手法を検討した。音声については不特定話者に対するスタイル変換法を提案した。これにより任意の話者の読み上げ音声のみでその話者が感情表現や発話様式をもった音声を生成できることを示した。歌声については重回帰モデルによる歌唱スタイル制御法を提案し、歌声合成において歌唱スタイルを直観的に制御できることを示した。言語の多様化については、任意の話者の母国語音声のみで外国語音声を合成できるクロスリンガル音声合成を提案した。
3: やや遅れている
提案法の評価、従来法との比較には長時間の音声データが必要であるが、その収録の準備に時間がかかったため、音声の収録および提案法の予備的検討に留まった。
時間がかかる作業であった音声収録の準備を完了することができたので、本年度は音声の収録、理論の確立、実装および評価を予定どおり行っていく。
予定していた収録の準備に時間がかかり、音声収録を完了することができず、その経費を次年度に回したため。音声収録に必要な経費として、平成26年度請求額とあわせて使用する予定である。
すべて 2014 2013 その他
すべて 雑誌論文 (7件) (うち査読あり 4件、 謝辞記載あり 1件) 学会発表 (6件)
Speech Communication
巻: 57 ページ: 144-154
10.1016/j.specom.2013.09.014
日本音響学会2014年春季研究発表会講演論文集
巻: vol.1 ページ: 413-414
巻: vol.1 ページ: 405-406
Proc. 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013
巻: vol.1 ページ: 7864-7867
巻: vol.1 ページ: 7859-7863
Proc. 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013
巻: vol.1 ページ: 378-382
日本音響学会2013年秋季研究発表会講演論文集
巻: vol.1 ページ: 351-352