研究課題/領域番号 |
20K19818
|
研究機関 | 東京大学 |
研究代表者 |
中村 友彦 東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 音響情景分析 / 時間領域深層学習 / 多重解像度解析 / 音源分離 / 音響信号処理 / 深層学習 / 機械学習 |
研究実績の概要 |
本年度の成果は以下の通りである. 1. 昨年度まで得られた成果をもとに,離散ウェーブレット変換を用いたダウンサンプリング層を拡張した.昨年度まで主に検討してきた提案層は既存のウェーブレットを用いてきた.しかし,既存のウェーブレットは音源分離のために設計されたものではない.そこで,ウェーブレットと深層ニューラルネットワークの同時学習について検討を行った.同時学習することで,特にモデルサイズが小さい場合に性能が向上するを示した.また,学習中であっても離散ウェーブレット変換がアンチエイリアシングフィルタを持つ条件を求め,それを実際に実現可能な形で導入した層とも比較した.この結果から,この条件を導入することがパラメータ初期化への頑健性を大きく向上させることを示した.それらの研究成果に関して,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,当該論文において第17回日本音響学会・独創研究奨励賞板倉記念を含む2件の賞を受賞した. 2. さらに,多チャネル音源分離への拡張も検討した.具体的には,周波数間の相関を考慮した多チャネル音源分離モデルを実現するため,パワースペクトログラム領域の分離モデルと時間領域での分離モデルを組み合わせる方法を提案した.この時間領域での分離モデルとして,これまで検討してきた音源分離手法を利用することで,分離性能が向上することを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本年度は昨年度の検討を基に離散ウェーブレット変換をベースにした層を拡張し,それらの実験結果をまとめた.その成果は,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,提案法を多チャネル音源分離へと応用した手法も検討しており,当初の計画以上に進展している.
|
今後の研究の推進方策 |
来年度は,今年度行った多チャネル音源分離手法への応用の検討を基に,査読付き論文誌への投稿・採択を目指す.
|
次年度使用額が生じた理由 |
今年度初頭から夏にかけてCOVID-19の流行が弱まり,国際会議・国内会議の現地開催の可能性もあったものの,冬にかけてのデルタ株,オミクロン株の流行により全てオンライン開催となった.そのため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を 計画していたが,流通悪化による半導体製品の品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.旅費に関しては,当該内容での発表を現地で行うことができるようになったため,その旅費に使用する.また,高性能計算機の購入に関しても次年度に行う予定である.
|