2015 Fiscal Year Annual Research Report
Project/Area Number |
15H02724
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
小林 隆夫 東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)
|
Co-Investigator(Kenkyū-buntansha) |
郡山 知樹 東京工業大学, 総合理工学研究科(研究院), 助教 (50749124)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 音声情報処理 / テキスト音声合成 / 韻律生成 / GPR音声合成 |
Outline of Annual Research Achievements |
テキスト音声合成の新たな枠組みであるガウス過程回帰(GPR)に基づく手法において,未確立であった韻律生成すなわち基本周波数(F0)の時間変化パタンと音韻継続長系列の予測手法の開発に重点を置いて研究を行い,以下の成果が得られた。 (1) GPRに基づくF0パタン生成に関して,開発済みであるGPRに基づく音声のスペクトルパラメータ系列生成手法を拡張した手法を提案した。スペクトルパラメータ系列と異なり,F0パタンは時間的に不連続となるという問題に対処するため,提案手法ではまず有声/無声区間の推定処理をガウス過程識別(GPC)を利用して行い,次に有声区間を対象にGPRに基づいたF0生成を行うことにより,F0パタン生成が可能なことを示した。 (2) GPR に基づく音韻継続長予測に関して,スペクトルパラメータ系列生成やF0パタン生成と同様の枠組みによる手法を提案し,さらにGPRに用いるフレームコンテキストの選択についても検討した。上記提案F0生成法と組み合わせて生成された韻律の客観評価を行い,従来のHMM音声合成手法に比べ歪みが大幅に減少する結果が得られた。 (3) スペクトル・韻律を共にGPRに基づいて生成するGPR音声合成システムを構築し,主観品質の観点から従来音声合成システムとの比較評価を行い,HMM音声合成と比べ有意に品質が向上する結果が得られた。 (4) ユニバーサルコミュニケーションに向けた音声合成として,日本語音声合成の他にも,韻律生成が難しい声調言語の一つであるタイ語にGPR音声合成手法を適用し,韻律の品質が向上することを示した。また,英語音声合成のためのフレームコンテキストに関する基礎的な検討を行った。 この他に,多様な話者性やスタイルに音声合成に向けたモデル適応手法の提案や,モデル学習に必要となる学習用音声データの自動韻律ラベリングに関する検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は,より自然で多様な音声の合成を可能とするために,新たな音声合成の枠組みであるガウス過程回帰に基づく音声合成(GPR音声合成)手法を提案し,その基盤技術を確立することにあり,研究初年度においては,未確立であった韻律生成手法の開発に重点をおいて研究を進め,GPR音声合成システムを実現することを目標としていた。 この観点からすると,入力言語情報からガウス過程回帰に基づいて韻律の時間変化パタンを生成する手法を提案し,確立済みのスペクトル生成と組み合わせたGPR音声合成システムを構築できたこと,また実現したGPR音声合成システムの客観・主観評価結果から,従来のHMM音声合成システムの性能を有意に上回ることを示すことができたことから,初年度の目標は十分達成できたと言える。さらにGPR音声合成手法に基づいた多様な話者性やスタイルによる音声合成のためのモデル適応手法の検討や,ユニバーサルコミュニケーションに向けたタイ語や英語など日本語以外の音声合成の検討を行うことができたことから,概ね順調に進んでいると判断した。
|
Strategy for Future Research Activity |
研究初年度の研究は概ね計画通り進んでおり,計画の特段の変更は不要なことから,当初の計画に沿ってこのまま研究を進めていく。但し,研究開始当初に計画していたインドネシア語への適用に関しては,言語的な観点からはインドネシア語と英語に類似点が多いこと,インドネシア語に関する研究協力者の都合も考慮した上で,これ以上の検討は行わないこととし,その代わりに英語への適用に研究の比重を移すことにする。
|