研究課題
本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,多くの応用が期待されている.具体的には,音響信号を対象とした音源分離の数理的深化と高性能化を目的として,申請者が過去に提案した手法である「独立低ランク行列分析(ILRMA)」を数理的に一般化した新しい音源分離フレームワークを確立する.これは「音源間の統計的独立性と各音源の構造に関する制約条件」という新たな考え方であり,いかに適切な音源構造制約を与えるかについて,数理的・データ的観点から発展させる.具体的には「一般化ガウス分布生成モデル」と「音源モデルplug-andplayな最適化法」の理論解析と確立,「深層学習に基づく音源教師あり手法」への発展,「ユーザの介入を組み合わせたインタラクティブ音源分離手法」の開発の3点を目標とする.3年目である令和3年度は,「音源モデルのplug-and-playが可能な最適化法」について計画通り進めることができ,その効果が認められトップジャーナルへの採録・掲載に至った.さらに,この手法の応用として,調波打楽器音分離(HPSS)を音源モデルとした時間周波数マスクに基づくブラインド音源分離についても,トップカンファレンスでの発表を実施し,さらにより詳細な実験を追加してジャーナルに投稿できた.これらは,申請者が掲げる全ての研究計画が予定通りに実施されたことによる成果であった.
すべて 2022 2021
すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 4件) 学会発表 (22件) (うち国際学会 7件、 招待講演 1件)
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
巻: E105-A (6) ページ: -
IEEE/ACM Transactions on Audio, Speech, and Language Processing
巻: 29 ページ: 1609~1625
10.1109/TASLP.2021.3073863
Acoustical Science and Technology
巻: 42 ページ: 222~225
10.1250/ast.42.222
Signal Processing
巻: 188 ページ: 108183~108183
10.1016/j.sigpro.2021.108183