研究課題/領域番号 |
23K20017
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1002:人間情報学、応用情報学およびその関連分野
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
須田 仁志 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (60981438)
|
研究期間 (年度) |
2023-08-31 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | テキスト音声合成 / 感情音声合成 / 声質制御 / 生成AI |
研究開始時の研究の概要 |
音声合成システムを利用する際には,利用目的に応じた声質(話者らしさ)の選択が重要である.しかし従来手法では,声質は実在の話者に制約され,これを自在に制御することは難しい.本研究では,所望の声質でのテキスト音声合成を実現するため,プロンプト(声質を表現するテキスト)および視覚的インタフェースを通じて合成音声の声質を手軽に制御できる技術を開発する.構築した技術をWebインタフェースとして利用可能にし,合成音声の品質やユーザビリティなどの観点から本技術の有効性を多角的に評価する.
|