2021 Fiscal Year Annual Research Report
Unification of Deep Learning and Generalized Mathematical Model for Independence-Based Audio Source Separation
Project/Area Number |
19K20306
|
Research Institution | Kagawa National College of Technology |
Principal Investigator |
北村 大地 香川高等専門学校, 電気情報工学科, 講師 (40804745)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 音源分離 / 補聴器 / 深層学習 / アレイ信号処理 |
Outline of Annual Research Achievements |
本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,多くの応用が期待されている.具体的には,音響信号を対象とした音源分離の数理的深化と高性能化を目的として,申請者が過去に提案した手法である「独立低ランク行列分析(ILRMA)」を数理的に一般化した新しい音源分離フレームワークを確立する.これは「音源間の統計的独立性と各音源の構造に関する制約条件」という新たな考え方であり,いかに適切な音源構造制約を与えるかについて,数理的・データ的観点から発展させる.具体的には「一般化ガウス分布生成モデル」と「音源モデルplug-andplayな最適化法」の理論解析と確立,「深層学習に基づく音源教師あり手法」への発展,「ユーザの介入を組み合わせたインタラクティブ音源分離手法」の開発の3点を目標とする. 3年目である令和3年度は,「音源モデルのplug-and-playが可能な最適化法」について計画通り進めることができ,その効果が認められトップジャーナルへの採録・掲載に至った.さらに,この手法の応用として,調波打楽器音分離(HPSS)を音源モデルとした時間周波数マスクに基づくブラインド音源分離についても,トップカンファレンスでの発表を実施し,さらにより詳細な実験を追加してジャーナルに投稿できた.これらは,申請者が掲げる全ての研究計画が予定通りに実施されたことによる成果であった.
|
Research Products
(26 results)