2021 Fiscal Year Annual Research Report
あらゆる環境音を分析可能とする音響イベント検出手法の検討
Project/Area Number |
19K20304
|
Research Institution | Doshisha University |
Principal Investigator |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 環境音分析 / 音響イベント検出 / 音響シーン分類 / マルチタスク学習 / スパース性 / 不均衡データ |
Outline of Annual Research Achievements |
本研究課題では,音響処理技術において近年大きな注目を集めている環境音分析において,少量の環境音データのみを用いた場合でも高い分析性能を示すモデル学習手法の実現を目指した.とりわけ,環境音のドメイン知識を有効活用し,少量のデータからでも効率的に環境音分析可能な手法についてさらに検討を進めた.令和3年度は(1) 音響イベントの発生の不均衡や,音響イベントの発生がまれであるという性質に着目して検討を進めた.また,(2) 収録環境(シーン)と発生する音響イベントの種類が関連している性質に着目した環境音分析手法について,昨年度に引き続き検討を進めた.具体的には,(1)-1 音響イベント検出において,各音響イベントの継続長がデータ不均衡問題を引き起こし音響イベントモデル学習に悪影響を及ぼすことを突き止め,不均衡条件下でも性能低下を引き起こさない手法を提案した.(1)-2 さらに,音が発生していない無音区間が音響イベント検出のモデル学習に破滅的な影響を及ぼすことを明らかにし,無音区間の影響を低減可能な音響イベント検出のためのモデル学習方法を提案した.これらの成果は音響処理のトップ会議であるICASSP2021での発表を行った他,電子情報通信学会のFundamentals reviewにまとめて出版した.(2)-1 音響イベント間の関連性,シーン間の関連性,音響イベントとシーンの関連性を同時に考慮した環境音分析手法として,グラフ深層学習に基づく手法を提案し分析性能を向上させることに成功した.(2)-2 また,音情報にとどまらず,テキストによりシーン情報を活用可能な環境音分析手法も提案した.これらの成果は環境音分析研究のトップ会議であるICASSP2022や日本音響学会で発表を行い大きな関心を集めることに成功した.
|
Research Products
(21 results)