2023 Fiscal Year Annual Research Report

話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援

Research Project

Project/Area Number	22H00673
Allocation Type	Single-year Grants
Research Institution	Tohoku University
Principal Investigator	能勢隆東北大学, 工学研究科, 准教授 (90550591)
Co-Investigator(Kenkyū-buntansha)	伊藤彰則東北大学, 工学研究科, 教授 (70232428)
Project Period (FY)	2022-04-01 – 2025-03-31
Keywords	CALL / 英語学習支援 / リスニング学習支援 / テキスト音声合成 / 深層学習 / スタイルモーフィング
Outline of Annual Research Achievements	本研究課題では、「音響工学および音声知覚の観点から、リスニング能力の効率的な向上のための方法論とはなにか?」という学術的問いに対する解を導くため、これまで我々が統計的音声合成、機械学習、対話型英会話学習システムなどの研究により培ってきた個別の要素技術を融合・発展させ、話者・地域・スタイル・訛りといった英語音声の特徴を深層学習に基づくモーフィング技術により段階的にシミュレーション可能な全く新しい実環境リスニング学習支援の実現を目指し、以下の具体的な4項目について検討を行うことを目的とする。(a)多様な話者・地域・スタイルを有する音声コーパスの設計と構築、(b)深層学習に基づくモーフィング音声合成技術の確立、(c)モーフィング音声合成を用いたリスニング学習支援システムの開発、(d)提案システムによる実環境におけるリスニング能力向上の実証実験。2023年度は上記のうち(b)および(c)について話速スタイルの観点から検討を行った。(b)については、Glow-TTSをベースとして話速情報を埋め込むことにより話速および話速に関係するスタイル（話速スタイル）の制御が可能であることを示すとともに、テキストエンコーダの改良により、音声・スタイルの再現性についての改善手法を提案し、その有効性を客観指標により示した。(c)についてはWebベースで利用可能な段階的な話速制御に基づくリスニング学習・評価システムを構築した。(d)については(c)のシステムをクラウドソーシングにおり実際に利用してもらい、従来の話速制御を行わないシステムと比較してリスニング能力が向上することを実験的に示した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 2023年度は当初は(b)深層学習に基づくモーフィング音声合成技術の確立、および(c)モーフィング音声合成を用いたリスニング学習支援システムの開発、の一部を行うことを予定していたが、(c)について簡易的なシステムの構築を優先したため、結果としてシステムの構築が完了し、(d)の提案システムによる実環境におけるリスニング能力向上の実証実験、まで行うことができた。
Strategy for Future Research Activity	2023年度までに当初予定していた(a)多様な話者・地域・スタイルを有する音声コーパスの設計と構築、(b)深層学習に基づくモーフィング音声合成技術の確立、(c)モーフィング音声合成を用いたリスニング学習支援システムの開発、(d)提案システムによる実環境におけるリスニング能力向上の実証実験については、話速スタイル制御、について一通り完了することができた。これにより全体的なシステムの枠組みが完成したため、2024年度については地域・話者に伴うスタイル（アクセント＝訛り）の変化について検討を進める。具体的にはまずは既存のL2話者による英語発話音声コーパスのサーベイを行い、それらを利用した音声合成およびスタイル・訛りの度合いの制御について検討を進める。また、度合いの制御性能および音声の品質についても改善を検討する。

Research Products
(6 results)

All 2024 2023

All Journal Article (3 results) Presentation (3 results)

[Journal Article] 英語リスニング学習支援のための複数話速スタイルのモデル化と制御に関する検討2024
- Author(s)
  千葉理揮，能勢隆，伊藤彰則
- Journal Title
  
  日本音響学会2023年春季研究発表会講演論文集
  
  Volume: - Pages: 913-916
[Journal Article] 深層学習に基づく拡張性の高い軽量なテキスト音声合成システムの開発に向けた検討2024
- Author(s)
  金泰誠，伊藤彰則，能勢隆
- Journal Title
  
  東北大学電気通信研究所音響工学研究会予稿集
  
  Volume: - Pages: 1-6
[Journal Article] 深層学習に基づく拡張性の高い軽量な音声合成システム構築に向けた検討2024
- Author(s)
  金泰誠，伊藤彰則，能勢隆
- Journal Title
  
  令和6年東北地区若手研究者研究発表会講演資料
  
  Volume: - Pages: 17-19
[Presentation] 深層学習に基づく拡張性の高い軽量なテキスト音声合成システムの開発に向けた検討2024
- Author(s)
  金泰誠
- Organizer
  東北大学電気通信研究所音響工学研究会
[Presentation] 深層学習に基づく拡張性の高い軽量な音声合成システム構築に向けた検討2024
- Author(s)
  金泰誠
- Organizer
  令和6年東北地区若手研究者研究発表会
[Presentation] 英語リスニング学習支援のための複数話速スタイルのモデル化と制御に関する検討2023
- Author(s)
  千葉理揮
- Organizer
  日本音響学会2023年春季研究発表会

2023 Fiscal Year Annual Research Report

話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援

Principal Investigator

能勢 隆 東北大学, 工学研究科, 准教授 (90550591)

Current Status of Research Progress

Reason

Research Products

[Journal Article] 英語リスニング学習支援のための複数話速スタイルのモデル化と制御に関する検討2024

Author(s)

Journal Title

[Journal Article] 深層学習に基づく拡張性の高い軽量なテキスト音声合成システムの開発に向けた検討2024

Author(s)

Journal Title

[Journal Article] 深層学習に基づく拡張性の高い軽量な音声合成システム構築に向けた検討2024

Author(s)

Journal Title

[Presentation] 深層学習に基づく拡張性の高い軽量なテキスト音声合成システムの開発に向けた検討2024

Author(s)

Organizer

[Presentation] 深層学習に基づく拡張性の高い軽量な音声合成システム構築に向けた検討2024

Author(s)

Organizer

[Presentation] 英語リスニング学習支援のための複数話速スタイルのモデル化と制御に関する検討2023

Author(s)

Organizer

能勢隆東北大学, 工学研究科, 准教授 (90550591)