研究課題/領域番号 |
24K20807
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
坂東 宜昭 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (40828167)
|
研究期間 (年度) |
2024-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 音響イベント定位・検出 / 環境音認識 / 情報統合 / 大規模汎用モデル / マイクアレイ信号処理 |
研究開始時の研究の概要 |
本研究では、多様な環境に即応できる環境音認識システムを実現するため、大規模汎用モデルとマイクアレイ信号処理を各々の長所を最大限生かして統合する方法を確立する。特に、アノテーションコストが膨大な現行のEnd-to-End (E2E) 型システムに代わり、構築が容易な部分問題を解くサブシステム群を効果的に統合して音響イベント定位・検出 (SELD) システムを実現する方法を明らかにする。また、古典的なカスケード型システムと異なり、混合音から並列に情報抽出した結果を統合することで、E2E型に比肩する性能を達成する枠組みの構成法を明らかにする。
|