2022 年度実施状況報告書

eスポーツ理解に向けた実況解説音声の分析及び音声合成アルゴリズムの開発

研究課題

研究課題/領域番号	22K17945
研究機関	東京大学
研究代表者	齋藤佑樹東京大学, 大学院情報理工学系研究科, 助教 (20907901)
研究期間 (年度)	2022-04-01 – 2025-03-31
キーワード	音声合成 / eスポーツ / 実況解説音声 / 深層学習
研究実績の概要	本年度は，実況解説音声コーパスの整備を実施した．これまでに構築した SMASH コーパスは実況解説者の音声データしか含まれなかったが，それに加えてゲームプレイヤーの音声も話者の承諾を得て公開した．これにより，実況解説者だけでなく，ゲームプレイヤーの感情も考慮した実況解説音声合成モデルの構築も可能になった．本年度はさらに，自発性の高い実況解説音声におけるポーズ挿入をより高精度に行うための機械学習アルゴリズムを設計・評価した．今後は，このアルゴリズムを実際の実況解説音声合成に適用する．
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由当初予定していたプロ実況解説者の音声収録が遅れている．次年度以降引き続き実施予定である．
今後の研究の推進方策	引き続き実況解説音声データベースの構築・整備を進めるとともに，本年度で設計した機械学習アルゴリズムを用いた実況解説音声合成のベースラインモデルを構築する予定である．
次年度使用額が生じた理由	プロ実況解説者の音声収録が遅れたためである．次年度に引き続き使用予定である．

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] More differentiated pause insertion for phoneme-based multi-speaker TTS models2023
- 著者名/発表者名
  Dong Yang, Tomoki Koriyama, Yuki Saito, Takaaki Saeki, Detai Xin, Hiroshi Saruwatari
- 学会等名
  日本音響学会 2023年春季研究発表会