研究課題/領域番号 |
19K20304
|
研究機関 | 同志社大学 |
研究代表者 |
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 環境音分析 / 音響イベント検出 / 音響シーン分類 / スパース性 / マルチタスク学習 / 不均衡データ |
研究実績の概要 |
本研究課題は,音響処理技術において重要なトピックの1つである環境音分析において,少量の環境音データのみを用いた場合でも高い分析性能を達成する手法の実現を目指す.とりわけ本課題では,環境音のドメインに基づく知識を有効活用することで少量のデータからでも効率的に環境音分析可能な手法について検討を行う. 平成31年度は,(1) 音響イベントの共起性とスパース性を考慮することで少量のデータから環境音を分析する手法について検討を進めたが,令和2年度は (2) 収録環境(シーン)と発生する音響イベントの種類が関連している性質に着目した環境音分析手法について詳細に検討を進めた. 具体的なアプローチとしては,(2)-1.シーンと音響イベントのマルチタスク深層学習により,お互いの情報を深層学習ネットワーク内で共有し同時分析を行う手法を提案し,従来法よりも高い性能で環境音を分析できることを示した.(2)-2.さらに,シーンどうしの類似度を考慮するために,Teacher-Student学習をマルチタスク深層学習に組み込んだ手法も提案し,さらに分析性能を向上させることに成功した.(2)-3.また,収録環境(シーン)と発生する音響イベントの種類の関連を考慮した性能評価手法も提案し,より現実の状況に即した評価実験が可能になることを確認した.これらの成果は環境音分析研究のトップ会議であるICASSP2020やDCASE2020で発表を行い大きな関心を集めた他,ジャーナル論文にまとめ出版した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
ジャーナル論文1編,国際会議論文5編(うち4編は分野のトップ会議であるICASSPやDCASE Workshop),国内学会発表5件という成果が得られた.また,これらに関連する成果として,3件招待講演や1件の特別授業を行い,多くの参加者と反響を得た. また,研究成果の一部は令和3年度に計画していたものであるなど,当初の予定よりも早く研究成果を挙げることに成功しており,計画以上に研究が進展していると言える.
|
今後の研究の推進方策 |
現在順調に研究が進展しており,当初の計画から大きな変更は必要ないと考えている.今後は,(1) 音響イベントの共起性とスパース性を考慮した手法と (2) 収録環境(シーン)と発生する音響イベントの種類が関連している性質に着目した手法の統合手法について検討を進め,さらに少量のデータで高い環境音分析性能を達成することを目指す.また,補聴器やセキュリティモ二タリング機器などへの環境音分析の適用といった実用的な応用についても引き続き検討を進める.
|
次年度使用額が生じた理由 |
新型コロナ等の影響により国際会議や国内学会が遠隔開催となったため旅費の支出が不要となり,次年度使用額が生じた.研究計画が当初の予定以上に進展しているため,生じた次年度使用額,および,今年度請求額は論文投稿費や英文添削費用,また計算機の追加購入により使用し,研究をさらに加速させることとする.
|