Research on retriving speech and acoustic dark data
Project/Area Number |
23K24895
|
Project/Area Number (Other) |
22H03639 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Keio University (2024) The University of Tokyo (2022-2023) |
Principal Investigator |
高道 慎之介 慶應義塾大学, 理工学部(矢上), 准教授 (90784330)
|
Co-Investigator(Kenkyū-buntansha) |
井本 桂右 同志社大学, 文化情報学部, 准教授 (90802116)
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)
Fiscal Year 2025: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2024: ¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2023: ¥5,070,000 (Direct Cost: ¥3,900,000、Indirect Cost: ¥1,170,000)
Fiscal Year 2022: ¥5,070,000 (Direct Cost: ¥3,900,000、Indirect Cost: ¥1,170,000)
|
Keywords | 音声認識合成 / 音響認識合成 / ダークデータ / コーパス |
Outline of Research at the Start |
本研究課題は,音声音響ダークデータから,超大規模かつ広範利用できる音声音響コーパスを構築する方法論を扱う.その実現にあたり,(1) 音声音響ダークデータを自動取得するWeb工学技術の開発,(2)ダークデータからその利用可能性を定量化する機械学習技術の開発,(3)大規模データに対する効率的なラベリング法,(4)種々の音声音響認識合成における評価を実施する.
|
Outline of Annual Research Achievements |
本年度は (1) 評価ループに基づく音声合成,(2) Webデータからのコーパス構築法,(3) 音響イベントとシーンの同時分析を提案した. (1) 評価ループに基づく音声合成については,ダークデータから音声合成を構築する方法を提案した.ダークデータに対するデータ洗練処理が機械学習にとって最適とは限らないため,最終的な機械学習性能が最大になるようにデータ洗練・選択を実行する方法を提案した. (2) Webデータからのコーパス構築法については,動画に紐づくメタ情報を用いて,所望の音声データを構築する方法を提案した. (3) 音響イベントとシーン同時分析においては,Webデータのようなノイジーなデータにしばしば登場する乱出データを分析する方法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定通りに進行している.
|
Strategy for Future Research Activity |
大規模音声音響モデル,大規模音声コーパスの頒布を進める.
|
Report
(2 results)
Research Products
(22 results)