2021 Fiscal Year Research-status Report
時間領域深層学習と多重解像度解析を融合した音響情景分析の研究
Project/Area Number |
20K19818
|
Research Institution | The University of Tokyo |
Principal Investigator |
中村 友彦 東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 音響情景分析 / 時間領域深層学習 / 多重解像度解析 / 音源分離 / 音響信号処理 / 深層学習 / 機械学習 |
Outline of Annual Research Achievements |
本年度の成果は以下の通りである. 1. 昨年度まで得られた成果をもとに,離散ウェーブレット変換を用いたダウンサンプリング層を拡張した.昨年度まで主に検討してきた提案層は既存のウェーブレットを用いてきた.しかし,既存のウェーブレットは音源分離のために設計されたものではない.そこで,ウェーブレットと深層ニューラルネットワークの同時学習について検討を行った.同時学習することで,特にモデルサイズが小さい場合に性能が向上するを示した.また,学習中であっても離散ウェーブレット変換がアンチエイリアシングフィルタを持つ条件を求め,それを実際に実現可能な形で導入した層とも比較した.この結果から,この条件を導入することがパラメータ初期化への頑健性を大きく向上させることを示した.それらの研究成果に関して,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,当該論文において第17回日本音響学会・独創研究奨励賞板倉記念を含む2件の賞を受賞した. 2. さらに,多チャネル音源分離への拡張も検討した.具体的には,周波数間の相関を考慮した多チャネル音源分離モデルを実現するため,パワースペクトログラム領域の分離モデルと時間領域での分離モデルを組み合わせる方法を提案した.この時間領域での分離モデルとして,これまで検討してきた音源分離手法を利用することで,分離性能が向上することを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度は昨年度の検討を基に離散ウェーブレット変換をベースにした層を拡張し,それらの実験結果をまとめた.その成果は,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,提案法を多チャネル音源分離へと応用した手法も検討しており,当初の計画以上に進展している.
|
Strategy for Future Research Activity |
来年度は,今年度行った多チャネル音源分離手法への応用の検討を基に,査読付き論文誌への投稿・採択を目指す.
|
Causes of Carryover |
今年度初頭から夏にかけてCOVID-19の流行が弱まり,国際会議・国内会議の現地開催の可能性もあったものの,冬にかけてのデルタ株,オミクロン株の流行により全てオンライン開催となった.そのため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を 計画していたが,流通悪化による半導体製品の品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.旅費に関しては,当該内容での発表を現地で行うことができるようになったため,その旅費に使用する.また,高性能計算機の購入に関しても次年度に行う予定である.
|
Research Products
(9 results)