2020 Fiscal Year Research-status Report
時間領域深層学習と多重解像度解析を融合した音響情景分析の研究
Project/Area Number |
20K19818
|
Research Institution | The University of Tokyo |
Principal Investigator |
中村 友彦 東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 音響情景分析 / 時間領域深層学習 / 多重解像度解析 |
Outline of Annual Research Achievements |
本年度の成果は以下の通りである. 1. 時間領域深層ニューラルネットワークと多重解像度解析の構造の類似性に着眼し,信号処理の知見を融合した深層ニューラルネットワークの構築に向け検討を行った.従来の多くの深層学習モデルでは,特徴量が間引き操作によってダウンサンプリングされており,エイリアシングや情報の欠落が特徴量領域で起こりうる.これらの問題を同時に解決するため提案された離散ウェーブレット変換を用いたダウンサンプリング層に関して,実装にリフティングスキームと呼ばれる技法を用いることで,様々なウェーブレット基底関数を使用可能であることを示した.これにより,ウェーブレットから定まるローパス,ハイパスフィルタの周波数特性を容易に変更可能となり,これらの周波数特性と音源分離性能の間の関係性を調査できるようになった.また,深層ニューラルネットワークとウェーブレットの同時学習についても理論的検討を進めている. 2. 上述の取り組みを推し進め,信号処理の基本的に概念の1つであるサンプリング周波数に対して信号処理の知見と深層学習モデルを融合した手法の初期検討を行った.深層学習で使われる畳み込み層は信号処理で使われるデジタルフィルタとみなせることを発見した.これに着眼し,アナログフィルタからデジタルフィルタを設計する手法を畳み込み層の重みの生成過程として導入することで,サンプリング周波数に不変な構造を背後にもつ畳み込み層を構築できることを示した.この構造により,学習に用いていないサンプリング周波数についても,学習したサンプリング周波数と同等の分離性能が達成できることを実験により確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度は,主に離散ウェーブレット変換をベースにした層の理論部分を整備することができた.また,深層ニューラルネットワークとウェーブレットの同時学習に関しても理論的検討に入っており,順調に進展している.さらに,これらの手法に通底するアイディアを発展させ,サンプリング周波数不変な畳み込み層の初期検討にも着手しており,当初の計画以上に進展している.
|
Strategy for Future Research Activity |
来年度は,今年度行った提案層に関する理論的検討を踏まえ,様々なパラメータや実験条件での提案法の音源分離性能に関して詳細な調査を行い,査読付き論文誌への採択を目指す.また,他のアプリケーションへの適用可能性についても調査する.
|
Causes of Carryover |
今年度は,COVID-19の流行による国際会議・国内会議が全てオンライン開催となったため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を計画していたが,流通悪化やマイニング需要によるGPUの品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.現在も価格の高騰が続いているため,GPUクラウドサービスの利用も視野に入れつつ,次年度での高性能計算機の購入を検討する.
|
Research Products
(4 results)