2014 Fiscal Year Annual Research Report
ロバスト音声合成の深化と多言語音声コミュニケーションへの展開
Project/Area Number |
24300071
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 隆夫 東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)
|
Co-Investigator(Kenkyū-buntansha) |
能勢 隆 東北大学, 工学(系)研究科(研究院), 講師 (90550591)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | テキスト音声合成 / HMM音声合成 / 基本周波数正規化学習 / 韻律ラベリング / クロスリンガル音声合成 / 国際情報交換(インドネシア) |
Outline of Annual Research Achievements |
ロバスト音声合成技術の深化・発展を目指し、第二年度まで得られた成果を基に研究を進め、基本技術に関する理論的検討、提案手法の高度化を行うと共に、ロバスト音声合成の多言語への応用に関してタイ語、インドネシア語、英語について検討を行い、以下の成果が得られた。 1.表現性にロバストな音声合成法:日本語合成音声のアクセント型の誤りを減らすために、アクセント型高低パタンに基づく基本周波数正規化学習の検討を行い、評価実験を通して有効性を示した。また、統計的音声合成手法の新たなアプローチであるガウス過程回帰に基づく音声合成手法に関して、従来の隠れマルコフモデルに基づく手法で有効性が示されている系列内変動と動的特徴量を提案手法にも導入することにより、性能がさらに改善できることを示した。 2.自発音声・会話音声の合成:品質の高い合成音声を得るためには、適切にコンテキストラベリングされた学習データが必要であるが、人手による正確なラベリング作業は高コストになる問題がある。これに対し、日本語文音声音声のアクセント句・アクセント型に関する自動韻律ラベリング手法を提案し、手動ラベリングと同等な合成音声が得られることを示した。 3.音声資源が乏しい言語の音声合成:タイ語音声合成において、トーン(声調)の再現性向上に有効なストレスコンテキストを自動でラベリングする手法を提案してその有効性を示した。また、インドネシア語音声合成に対しては、前年度に収録した男女各1名の音声データを用いて、プロトタイプ音声合成システムを検討した。 4.多言語の音声合成:共有決定木を利用した話者適応に基づくクロスリンガル音声合成手法について、英語・日本語を対象としたシステムのより詳細な検討を行った。さらに、モデルの性能を向上するために、新たな英語・日本語バイリンガル音声データの収録とラベリングを行った。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Causes of Carryover |
26年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
26年度が最終年度であるため、記入しない。
|