研究課題/領域番号 |
22H03639
|
配分区分 | 補助金 |
研究機関 | 東京大学 |
研究代表者 |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 講師 (90784330)
|
研究分担者 |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
キーワード | 音声認識合成 / 音響認識合成 / ダークデータ / コーパス |
研究実績の概要 |
本年度は (1) 評価ループに基づく音声合成,(2) Webデータからのコーパス構築法,(3) 音響イベントとシーンの同時分析を提案した. (1) 評価ループに基づく音声合成については,ダークデータから音声合成を構築する方法を提案した.ダークデータに対するデータ洗練処理が機械学習にとって最適とは限らないため,最終的な機械学習性能が最大になるようにデータ洗練・選択を実行する方法を提案した. (2) Webデータからのコーパス構築法については,動画に紐づくメタ情報を用いて,所望の音声データを構築する方法を提案した. (3) 音響イベントとシーン同時分析においては,Webデータのようなノイジーなデータにしばしば登場する乱出データを分析する方法を提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の予定通りに進行している.
|
今後の研究の推進方策 |
大規模音声音響モデル,大規模音声コーパスの頒布を進める.
|