2021 Fiscal Year Research-status Report
空間アテンション機構に基づく新しい音響シーン識別手法の確立
Project/Area Number |
20K11880
|
Research Institution | University of Tsukuba |
Principal Investigator |
山田 武志 筑波大学, システム情報系, 准教授 (20312829)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 音響シーン識別 / 音響イベント検出 / 空間アテンション機構 / マイクロホンアレー / ニューラルネットワーク / 空間信号処理 |
Outline of Annual Research Achievements |
音響シーン識別において複数のマイクの録音信号を入力することにより、音源の周波数特性などの音響特徴に加えて、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。これにより、音源の方向や種類などの事前情報を必要とせず、識別に適した指向特性を入力信号から自動的に形成することが可能となる。
2021年度は、前年度に引き続き、空間アテンション機構に基づく音響シーン識別手法の開発に取り組んだ。主な研究成果を以下にまとめる。 (1)複数の空間フィルタ出力への自動重み付けに基づく識別手法の開発:これは、異なる指向特性を有する空間フィルタを複数個用意し、それぞれの空間フィルタ出力に対する重みを推定して識別する手法であり、前年度に実験によりその有効性を示した。2021年度は、さらに空間フィルタの数が識別性能に及ぼす影響を調査した。 (2)空間フィルタの自動推定に基づく識別手法の開発:これは、空間フィルタそのものを推定し、推定した空間フィルタの出力を用いて識別する手法である。空間フィルタとしての振る舞いをある程度保証する拘束条件を新たに考案した結果、どの音が識別に有効であるかを自動的に見出し、またそれを強調するための空間フィルタを自動的に生成できることを確認した。 (3)半教師あり学習やWave-U-Netの適用:識別精度の向上を図るために、弱ラベルデータを用いた半教師あり学習やWave-U-Netの適用を検討し、その有効性を示した。これらの研究成果を査読なし国内会議論文、査読付き国際会議論文として発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度の計画として挙げた、空間アテンション機構に基づく音響シーン識別手法の開発と評価に取り組み、今後の性能向上の基礎となる知見や実験データを着実に得ることができた。また、その成果を査読あり国際会議論文、査読なし国内会議論文として発表した。以上のことから、おおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
前年度までに得た知見と実験データを用いて、引き続き提案手法の開発を行う。特に、空間フィルタの自動推定に基づく識別手法については、空間フィルタとしての振る舞いを保証する拘束条件をさらに改良する。また、各手法において音響シーンの中のどの音源が重要視されたのかを分析し、その分析結果に基づいてさらなる性能向上と応用分野の開拓を図る。
|
Causes of Carryover |
2021年度の計画として旅費を計上していたが、新型コロナウイルスの蔓延によりほとんどの学会がオンライン開催となったために次年度使用が生じることになった。この経費は2022年度に当初目的に沿って使用する予定である。
|
Research Products
(4 results)