Research Project
Grant-in-Aid for Early-Career Scientists
本研究では、多様な環境に即応できる環境音認識システムを実現するため、大規模汎用モデルとマイクアレイ信号処理を各々の長所を最大限生かして統合する方法を確立する。特に、アノテーションコストが膨大な現行のEnd-to-End (E2E) 型システムに代わり、構築が容易な部分問題を解くサブシステム群を効果的に統合して音響イベント定位・検出 (SELD) システムを実現する方法を明らかにする。また、古典的なカスケード型システムと異なり、混合音から並列に情報抽出した結果を統合することで、E2E型に比肩する性能を達成する枠組みの構成法を明らかにする。