研究課題/領域番号 |
24K15004
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立研究開発法人情報通信研究機構 |
研究代表者 |
沈 鵬 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所先進的音声翻訳研究開発推進センター, 主任研究員 (80773118)
|
研究分担者 |
LU Xugang 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所先進的音声翻訳研究開発推進センター, 主任研究員 (20362022)
|
研究期間 (年度) |
2024-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2024年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | latent representation / Speech recognition / Summarization / Meeting minutes system / Large speech model |
研究開始時の研究の概要 |
Motivated by the success of large language models, building large speech models(LSM) to handle a variety of speech tasks has become a hot direction. However, unlike text-based tasks, there isn't a set of meaningful autoregressive symbols available that would allow the models to process speech signals iteratively. In this project, our core objective is to build a speech representation-based recursive symbol system, aiming to allow the LSM to capture the multi-level logical relationships within speech signals.
|