2022 Fiscal Year Research-status Report
eスポーツ理解に向けた実況解説音声の分析及び音声合成アルゴリズムの開発
Project/Area Number |
22K17945
|
Research Institution | The University of Tokyo |
Principal Investigator |
齋藤 佑樹 東京大学, 大学院情報理工学系研究科, 助教 (20907901)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 音声合成 / eスポーツ / 実況解説音声 / 深層学習 |
Outline of Annual Research Achievements |
本年度は,実況解説音声コーパスの整備を実施した.これまでに構築した SMASH コーパスは実況解説者の音声データしか含まれなかったが,それに加えてゲームプレイヤーの音声も話者の承諾を得て公開した.これにより,実況解説者だけでなく,ゲームプレイヤーの感情も考慮した実況解説音声合成モデルの構築も可能になった. 本年度はさらに,自発性の高い実況解説音声におけるポーズ挿入をより高精度に行うための機械学習アルゴリズムを設計・評価した.今後は,このアルゴリズムを実際の実況解説音声合成に適用する.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初予定していたプロ実況解説者の音声収録が遅れている.次年度以降引き続き実施予定である.
|
Strategy for Future Research Activity |
引き続き実況解説音声データベースの構築・整備を進めるとともに,本年度で設計した機械学習アルゴリズムを用いた実況解説音声合成のベースラインモデルを構築する予定である.
|
Causes of Carryover |
プロ実況解説者の音声収録が遅れたためである.次年度に引き続き使用予定である.
|