2023 Fiscal Year Annual Research Report
Research on retriving speech and acoustic dark data
Project/Area Number |
22H03639
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 講師 (90784330)
|
Co-Investigator(Kenkyū-buntansha) |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Keywords | 音声認識合成 / 音響認識合成 / ダークデータ / コーパス |
Outline of Annual Research Achievements |
本年度は (1) 評価ループに基づく音声合成,(2) Webデータからのコーパス構築法,(3) 音響イベントとシーンの同時分析を提案した. (1) 評価ループに基づく音声合成については,ダークデータから音声合成を構築する方法を提案した.ダークデータに対するデータ洗練処理が機械学習にとって最適とは限らないため,最終的な機械学習性能が最大になるようにデータ洗練・選択を実行する方法を提案した. (2) Webデータからのコーパス構築法については,動画に紐づくメタ情報を用いて,所望の音声データを構築する方法を提案した. (3) 音響イベントとシーン同時分析においては,Webデータのようなノイジーなデータにしばしば登場する乱出データを分析する方法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定通りに進行している.
|
Strategy for Future Research Activity |
大規模音声音響モデル,大規模音声コーパスの頒布を進める.
|