言葉で指示するテキスト音声合成 ―ディレクション可能な仮想声優システムの実現―

研究課題

研究課題/領域番号	24K21322
研究種目	挑戦的研究(開拓)
配分区分	基金
審査区分	中区分61:人間情報学およびその関連分野
研究機関	名古屋工業大学
研究代表者	徳田恵一名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)
研究分担者	橋本佳名古屋工業大学, 工学(系)研究科(研究院), 准教授 (10635907) 南角吉彦名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
研究期間 (年度)	2024-06-28 – 2028-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	25,610千円 (直接経費: 19,700千円、間接経費: 5,910千円) 2027年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円) 2026年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円) 2025年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円) 2024年度: 7,540千円 (直接経費: 5,800千円、間接経費: 1,740千円)
キーワード	テキスト音声合成 / インタフェース / プロンプティング
研究開始時の研究の概要	深層学習の導入によりテキスト音声合成の品質が向上し、更には感情表現等の多様な発話スタイルの実現も容易となってきた。しかし、生成したい音声の発話スタイルを指定するインタフェースをどのように構成するかという新たな問題が浮上してきている。本研究では、画像生成AIのプロンプティングに着想を得て、声優に指示するように自然な言葉で発話スタイル等を指示できる音声合成システムを構築することを目指す。

報告書

(1件)

2024 審査結果の所見