研究課題/領域番号 |
23K11161
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 愛知淑徳大学 |
研究代表者 |
岸田 拓也 愛知淑徳大学, 人間情報学部, 助教 (80827907)
|
研究分担者 |
中鹿 亘 電気通信大学, 大学院情報理工学研究科, 准教授 (90749920)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 声質変換 / 感情変換 / エネルギーベースモデル / 音声信号処理 / 生成モデル |
研究開始時の研究の概要 |
本研究では、従来の声質変換課題をどのように再定義して取り組めば、声質変換技術をより自由自在で創造的なものにできるのかという学術的問いに答えるべく、変換対象が特定の声質属性内だけに制限されず、より柔軟な方法で目標声質が指定可能となるように問題設定の範囲を広げた声質変換課題に挑戦する。 1)目標声質の静的及び動的特徴の両方を再現、2)複数の声質属性を同時に制御する、3)テキストと声質とを関連づけることのできる人工知能の学習、これらを可能とする手法を生成モデルの一つである深層エネルギーベースモデルのポテンシャルを引き出すことで明らかにし、創造的声質変換の実現を目指す。
|