研究課題/領域番号 |
20H04207
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
赤木 正人 北陸先端科学技術大学院大学, 先端科学技術研究科, 名誉教授 (20242571)
|
研究分担者 |
鵜木 祐史 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | パラ言語情報 / 非言語情報 / 音声変換 / 非並行型学習 |
研究成果の概要 |
本研究では,音声変換(Voice Conversion: VC)による多言語音声へのパラ言語・非言語情報付加を最終目標として設定し,その中心課題の一つである話者性操作を目指して,多言語間での非並行型学習法の提案およびこの学習法にもとづいた多数話者間の属性変換システムの構築を検討する。具体的には,(A) VCのソース言語とターゲット言語が異なる場合の話者情報の扱い方,(B) 多話者対多話者属性変換,(C) 未学習話者を想定した場合の話者特徴の記述法,(D) 変換後の音声の品質・了解度保証である。これらすべてを深層学習の枠組みで検討し,適切な目的関数を設定することにより全体を最適化する。
|
自由記述の分野 |
音声情報処理
|
研究成果の学術的意義や社会的意義 |
話者のパラ言語および非言語情報を抽出し合成音声に付加することができる音声-音声翻訳のための多言語間音声変換システムを開発するために,その第一歩として,非言語情報の一つである話者属性(性別,年齢,声質等)の自由な変換操作を目指して,多言語間での音声変換のための非並行型学習法を提案し,これにもとづいた変換システムを検討する。これにより,ある言語で話をした話者の声と同じ声質で別の言語の音声を合成できる,しかも使用言語および使用話者を選ばないシステムの構築が可能となり,入力音声に含まれる話者属性を出力音声でも維持できることで,コミュニケーションの質を向上させることができる。
|