研究課題
ロバスト音声合成技術の深化・発展を目指し、第二年度まで得られた成果を基に研究を進め、基本技術に関する理論的検討、提案手法の高度化を行うと共に、ロバスト音声合成の多言語への応用に関してタイ語、インドネシア語、英語について検討を行い、以下の成果が得られた。1.表現性にロバストな音声合成法:日本語合成音声のアクセント型の誤りを減らすために、アクセント型高低パタンに基づく基本周波数正規化学習の検討を行い、評価実験を通して有効性を示した。また、統計的音声合成手法の新たなアプローチであるガウス過程回帰に基づく音声合成手法に関して、従来の隠れマルコフモデルに基づく手法で有効性が示されている系列内変動と動的特徴量を提案手法にも導入することにより、性能がさらに改善できることを示した。2.自発音声・会話音声の合成:品質の高い合成音声を得るためには、適切にコンテキストラベリングされた学習データが必要であるが、人手による正確なラベリング作業は高コストになる問題がある。これに対し、日本語文音声音声のアクセント句・アクセント型に関する自動韻律ラベリング手法を提案し、手動ラベリングと同等な合成音声が得られることを示した。3.音声資源が乏しい言語の音声合成:タイ語音声合成において、トーン(声調)の再現性向上に有効なストレスコンテキストを自動でラベリングする手法を提案してその有効性を示した。また、インドネシア語音声合成に対しては、前年度に収録した男女各1名の音声データを用いて、プロトタイプ音声合成システムを検討した。4.多言語の音声合成:共有決定木を利用した話者適応に基づくクロスリンガル音声合成手法について、英語・日本語を対象としたシステムのより詳細な検討を行った。さらに、モデルの性能を向上するために、新たな英語・日本語バイリンガル音声データの収録とラベリングを行った。
26年度が最終年度であるため、記入しない。
すべて 2015 2014
すべて 雑誌論文 (13件) (うち査読あり 9件、 謝辞記載あり 13件、 オープンアクセス 3件) 学会発表 (11件)
日本音響学会2015年春季研究発表会講演論文集
巻: CD-ROM ページ: 269-270
巻: CD-ROM ページ: 361-362
巻: CD-ROM ページ: 371-372
Proceedings of 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing
巻: ICASSP 2015 ページ: 4929-4933
IEEE Journal of Selected Topics in Signal Processing
巻: 8 ページ: 173-183
10.1109/JSTSP.2013.2283461
巻: 8 ページ: 221-228
10.1109/JSTSP.2013.2283459
Proceedings of 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing
巻: ICASSP 2014 ページ: 3862-3866
10.1109/ICASSP.2014.6854319
Proceedings of the 7th International Conference on Speech Prosody
巻: SPEECHPROSODY 7 ページ: 1057-1061
Proceedings of the 15th Annual Conference of the International Speech Communication Association
巻: INTERSPEECH 2014 ページ: 770-774
巻: INTERSPEECH 2014 ページ: 2337-2341
Proceedings of IEEE International Workshop on Machine Learning for Signal Processing
巻: MLSP 2014 ページ: 1-6
10.1109/MLSP.2014.6958921
Proceedings of 2014 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
巻: APSIPA ASC 2014 ページ: 1-4
10.1109/APSIPA.2014.7041599
日本音響学会2014年秋季研究発表会講演論文集
巻: CD-ROM ページ: 247-248