研究課題/領域番号 |
24300071
|
研究機関 | 東京工業大学 |
研究代表者 |
小林 隆夫 東京工業大学, 総合理工学研究科(研究院), 教授 (70153616)
|
研究分担者 |
能勢 隆 東北大学, 工学(系)研究科(研究院), 講師 (90550591)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | テキスト音声合成 / HMM音声合成 / 自然発話音声 / ガウス過程回帰 / トーン(声調) / クロスリンガル音声合成 / 共有決定木 / 国際情報交換(インドネシア) |
研究概要 |
ロバスト音声合成技術の深化・発展を目指し、初年度に続き基本技術に関する理論的検討、提案手法の高度化、新たな手法の提案を行う共に、ロバスト音声合成の多言語への応用に関してタイ語、インドネシア語、英語について検討を行い、以下の成果が得られた。 1.表現性にロバストな音声合成法:学習データ量の変化に対してロバストなモデル化手法として、新たな音素コンテキストセットの利用と基本周波数に関する正規化学習の導入を提案し、評価実験を通してその有効性を示した。また、統計的音声合成手法の新たなアプローチであるガウス過程回帰に基づく音声合成手法を提案し、基礎的な検討を行った結果、スペクトルのモデル化において従来の隠れマルコフモデルに基づく手法に比べて高い性能が得られる可能性を示した。 2.自発音声・会話音声の合成:初年度で提案した音韻・韻律コンテキストバランスを考慮した音声コーパス構築手法に基づいて、インターネットのツィート文等,自発性の高い音声データベース整備とそれを学習データに用いたモデル化を行い、複数ドメインコーパスを用いるモデル化手法の有効性を明らかにした。 3.音声資源が乏しい言語の音声合成:タイ語音声合成において、合成音声の自然性に大きな影響を及ぼすトーン(声調)の再現性向上に着目し、ストレスの有無を新たにコンテキストとして考慮する手法を提案してその有効性を示した。また、インドネシア語音声合成に対しては、男女各1名の音声データ収録を行い、プロトタイプシステム実現に向けた検討を進めた。 4.多言語の音声合成:初年度で提案した共有決定木を利用した話者適応に基づくクロスリンガル音声合成手法について、英語・日本語を対象としたシステムの詳細な検討を行った。その結果、従来法である状態マッピングに基づいた手法に比べてより高い客観性能を示すことを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は、ロバスト音声合成技術を深化・発展させ、利用可能な音声資源が乏しい条件下においても、個性や多様性を表出可能で自然性の高い韻律を持つ音声を合成するための技術を創出し、確立した技術を東南アジア諸国の音声資源が十分でない言語を含む多言語音声合成に応用したユニバーサルコミュニケーション実現に資することにあった。 この観点から研究を4項目に分けて実施した結果、それぞれの項目毎に当初の計画通りに研究が進み、期待した成果が得られたことに加え、ロバスト音声合成に関して新たな統計的音声合成のフレームワークの提案につながり、新たな検討を進めることができたことから、概ね順調に進んでいると判断した。
|
今後の研究の推進方策 |
第二年度迄の研究は概ね計画通り進んでおり、計画の特段の変更は不要なことから、当初の計画に沿ってこのまま研究を進めていく。
|
次年度の研究費の使用計画 |
招聘を予定していたスラバヤ工科大の研究協力者が別予算で研究室に滞在し研究を行ったことと、研究分担者が年度半ばで研究機関を異動した関係で、必要な研究基盤整備のための金額配分が当初の予定と異なってしまったため。 次年度が最終年度であることから、研究成果の公開のための費用と第二年度までに未完了の研究基盤整備の費用として使用する予定。
|