2020 Fiscal Year Research-status Report
空間アテンション機構に基づく新しい音響シーン識別手法の確立
Project/Area Number |
20K11880
|
Research Institution | University of Tsukuba |
Principal Investigator |
山田 武志 筑波大学, システム情報系, 准教授 (20312829)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 音響シーン識別 / 音響イベント検出 / 空間アテンション機構 / マイクロホンアレー / ニューラルネットワーク / 空間信号処理 |
Outline of Annual Research Achievements |
音響シーン識別において複数のマイクの録音信号を入力することにより、音源の周波数特性などの音響特徴に加えて、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。これにより、音源の方向や種類などの事前情報を必要とせず、識別に適した指向特性を入力信号から自動的に形成することが可能となる。 令和2年度は、空間アテンション機構に基づく音響シーン識別手法の開発に取り組んだ。主な研究成果を以下にまとめる。 (1)複数の空間フィルタ出力への自動重み付けに基づく識別手法の開発:これは、異なる指向特性を有する空間フィルタを複数個用意し、それぞれの空間フィルタ出力に対する重みを推定して識別する手法であり、実験によりその有効性を示した。この研究成果を査読付き国際会議論文として発表した。 (2)空間フィルタの自動推定に基づく識別手法の開発:これは、空間フィルタそのものを推定し、推定した空間フィルタの出力を用いて識別する手法であり、実験により初期評価を行った。その結果、空間フィルタを推定する際には、空間フィルタとしての振る舞いを保証する強い拘束条件が必要であることが明らかとなった。 (3)マルチタスク学習や転移学習の適用:識別精度の向上を図るために、マルチタスク学習や転移学習の適用を検討し、その有効性を示した。この研究成果を査読なし国内会議論文として発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2020年度の計画として挙げた、空間アテンション機構に基づく音響シーン識別手法の開発と評価に取り組み、今後の性能向上の基礎となる知見や実験データを着実に得ることができた。また、その成果を査読あり国際会議論文、査読なし国内会議論文として発表した。以上のことから、おおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
前年度に得た知見と実験データを用いて、引き続き提案手法の開発を行う。特に、空間フィルタの自動推定に基づく識別手法については、空間フィルタとしての振る舞いを保証する強い拘束条件を新たに導入する。具体的には、ニューラルネットワークの学習時に用いる損失関数による方法、及びマルチタスク学習による方法を比較検討する。また、各手法において音響シーンの中のどの音源が重要視されたのかを分析し、その分析結果に基づいてさらなる性能向上を図る。
|
Causes of Carryover |
2020年度の計画として旅費を計上していたが、新型コロナウイルスの蔓延によりほとんどの学会がオンライン開催となったために次年度使用が生じることになった。この経費は2021年度以降に当初目的に沿って使用する予定である。
|