2021 年度実績報告書

独立性に基づく音源分離の数理モデル一般化と深層学習の融合

研究課題

研究課題/領域番号	19K20306
研究機関	香川高等専門学校
研究代表者	北村大地香川高等専門学校, 電気情報工学科, 講師 (40804745)
研究期間 (年度)	2019-04-01 – 2022-03-31
キーワード	音源分離 / 補聴器 / 深層学習 / アレイ信号処理
研究実績の概要	本研究課題は，音源分離技術に関する数理的・実用的拡張を目的としている．音源分離とは，複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり，多くの応用が期待されている．具体的には，音響信号を対象とした音源分離の数理的深化と高性能化を目的として，申請者が過去に提案した手法である「独立低ランク行列分析（ILRMA）」を数理的に一般化した新しい音源分離フレームワークを確立する．これは「音源間の統計的独立性と各音源の構造に関する制約条件」という新たな考え方であり，いかに適切な音源構造制約を与えるかについて，数理的・データ的観点から発展させる．具体的には「一般化ガウス分布生成モデル」と「音源モデルplug-andplayな最適化法」の理論解析と確立，「深層学習に基づく音源教師あり手法」への発展，「ユーザの介入を組み合わせたインタラクティブ音源分離手法」の開発の3点を目標とする． 3年目である令和3年度は，「音源モデルのplug-and-playが可能な最適化法」について計画通り進めることができ，その効果が認められトップジャーナルへの採録・掲載に至った．さらに，この手法の応用として，調波打楽器音分離（HPSS）を音源モデルとした時間周波数マスクに基づくブラインド音源分離についても，トップカンファレンスでの発表を実施し，さらにより詳細な実験を追加してジャーナルに投稿できた．これらは，申請者が掲げる全ての研究計画が予定通りに実施されたことによる成果であった．

研究成果
(26件)

すべて 2022 2021

すべて雑誌論文 (4件) (うち査読あり 4件、オープンアクセス 4件) 学会発表 (22件) (うち国際学会 7件、招待講演 1件)

[雑誌論文] Supervised audio source separation based on nonnegative matrix factorization with cosine similarity penalty2022
- 著者名/発表者名
  Yuta Iwase and Daichi Kitamura
- 雑誌名
  
  IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  
  巻: E105-A (6) ページ: -
- 査読あり / オープンアクセス
[雑誌論文] Determined BSS Based on Time-Frequency Masking and Its Application to Harmonic Vector Analysis2021
- 著者名/発表者名
  Yatabe Kohei、Kitamura Daichi
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 29 ページ: 1609～1625
- DOI
  10.1109/TASLP.2021.3073863
- 査読あり / オープンアクセス
[雑誌論文] Interactive speech source separation based on independent low-rank matrix analysis2021
- 著者名/発表者名
  Oshima Fuga、Nakano Masaki、Kitamura Daichi
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 42 ページ: 222～225
- DOI
  10.1250/ast.42.222
- 査読あり / オープンアクセス
[雑誌論文] Joint-diagonalizability-constrained multichannel nonnegative matrix factorization based on time-variant multivariate complex sub-Gaussian distribution2021
- 著者名/発表者名
  Kamo Keigo、Mitsui Yoshiki、Kubo Yuki、Takamune Norihiro、Kitamura Daichi、Saruwatari Hiroshi、Takahashi Yu、Kondo Kazunobu
- 雑誌名
  
  Signal Processing
  
  巻: 188 ページ: 108183～108183
- DOI
  10.1016/j.sigpro.2021.108183
- 査読あり / オープンアクセス
[学会発表] 混合Differentiable DSPモデルによる混合楽器音からの合成パラメータ抽出の実験的評価2022
- 著者名/発表者名
  川村真也, 中村友彦, 北村大地, 猿渡洋, 高橋祐, 近藤多伸
- 学会等名
  日本音響学会 2022年春季研究発表会
[学会発表] 解像度の異なる複数の時間周波数表現を用いた独立低ランク行列分析2022
- 著者名/発表者名
  細谷泰稚, 北村大地, 矢田部浩平
- 学会等名
  日本音響学会 2022年春季研究発表会
[学会発表] Deficient basis estimation of noise spatial covariance matrix for rank-constrained spatial covariance matrix estimation method in blind speech extraction2021
- 著者名/発表者名
  Yuto Kondo, Yuki Kubo, Norihiro Takamune, Daichi Kitamura, and Hiroshi Saruwatari
- 学会等名
  IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)
- 国際学会
[学会発表] Linear multichannel blind source separation based on time-frequency mask obtained by harmonic/percussive sound separation2021
- 著者名/発表者名
  Soichiro Oyabu, Daichi Kitamura, and Kohei Yatabe
- 学会等名
  IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)
- 国際学会
[学会発表] Independent deeply learned tensor analysis for determined audio source separation2021
- 著者名/発表者名
  Naoki Narisawa, Rintaro Ikeshita, Norihiro Takamune, Daichi Kitamura, Tomohiko Nakamura, Hiroshi Saruwatari, and Tomohiro Nakatani
- 学会等名
  European Signal Processing Conference (EUSIPCO 2021)
- 国際学会
[学会発表] Empirical Bayesian independent deeply learned matrix analysis for multichannel audio source separation2021
- 著者名/発表者名
  Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, and Kazunobu Kondo
- 学会等名
  European Signal Processing Conference (EUSIPCO 2021)
- 国際学会
[学会発表] Speech enhancement by noise self-supervised rank-constrained spatial covariance matrix estimation via independent deeply learned matrix analysis2021
- 著者名/発表者名
  Sota Misawa, Norihiro Takamune, Tomohiko Nakamura, Daichi Kitamura, Hiroshi Saruwatari, Masakazu Une, and Shoji Makino
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
- 国際学会
[学会発表] Multichannel audio source separation with independent deeply learned matrix analysis using product of source models2021
- 著者名/発表者名
  Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, and Kazunobu Kondo
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
- 国際学会
[学会発表] Prior distribution design for music bleeding-sound reduction based on nonnegative matrix factorization2021
- 著者名/発表者名
  Yusaku Mizobuchi, Daichi Kitamura, Tomohiko Nakamura, Hiroshi Saruwatari, Yu Takahashi, and Kazunobu Kondo
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
- 国際学会
[学会発表] 非負値行列因子分解を導入したproduct of experts型音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021
- 著者名/発表者名
  蓮実拓也, 中村友彦, 高宗典玄, 猿渡洋, 北村大地, 高橋祐, 近藤多伸
- 学会等名
  情報処理学会第131回音楽情報科学研究会
[学会発表] 基底共有型非負値行列因子分解を用いた楽器音の音色変換2021
- 著者名/発表者名
  北村大地, 香西海斗
- 学会等名
  情報処理学会第131回音楽情報科学研究会
[学会発表] 独立低ランク行列分析に基づく音源分離とその発展2021
- 著者名/発表者名
  北村大地
- 学会等名
  電子情報通信学会信号処理研究会
- 招待講演
[学会発表] ヘビーテイル生成モデルに基づく独立深層学習テンソル分析2021
- 著者名/発表者名
  成澤直輝, 池下林太郎, 高宗典玄, 北村大地, 中村友彦, 猿渡洋, 中谷智広
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] コサイン類似度罰則条件付き非負値行列因子分解に基づく音源分離の実験的評価2021
- 著者名/発表者名
  岩瀬佑太, 北村大地
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] 独立深層学習行列分析を用いたランク制約付き空間共分散行列推定による音声強調2021
- 著者名/発表者名
  三澤颯大, 中村友彦, 高宗典玄, 北村大地, 猿渡洋
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] Product of Priors型確率分布を導入した音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021
- 著者名/発表者名
  蓮実拓也, 中村友彦, 高宗典玄, 猿渡洋, 北村大地, 高橋祐, 近藤多伸
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] 深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化2021
- 著者名/発表者名
  渡辺瑠伊, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] 多変量一般化Gauss分布に基づくランク制約付き空間共分散行列推定法における雑音欠落ランク空間基底推定2021
- 著者名/発表者名
  近藤祐斗, 久保優騎, 高宗典玄, 北村大地, 猿渡洋
- 学会等名
  日本音響学会 2021年秋季研究発表会
[学会発表] 楽譜情報を援用した音楽音響信号に対する混合Differentiable DSPモデルの合成パラメータ推定2021
- 著者名/発表者名
  川村真也, 中村友彦, 北村大地, 猿渡洋, 高橋祐, 近藤多伸
- 学会等名
  情報処理学会第132回音楽情報科学研究会（夏のシンポジウム）
[学会発表] 非負値行列因子分解を用いた被り音の抑圧2021
- 著者名/発表者名
  溝渕悠朔, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
- 学会等名
  情報処理学会第132回音楽情報科学研究会（夏のシンポジウム）
[学会発表] コサイン類似度罰則条件付き非負値行列因子分解に基づく音源分離の仮説検定2021
- 著者名/発表者名
  岩瀬佑太, 北村大地
- 学会等名
  第24回日本音響学会関西支部若手研究者交流研究発表会
[学会発表] 深層学習に基づく周波数帯域予測による高速音源分離法の実験的評価2021
- 著者名/発表者名
  渡辺瑠伊, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
- 学会等名
  第24回日本音響学会関西支部若手研究者交流研究発表会

2021 年度 実績報告書

独立性に基づく音源分離の数理モデル一般化と深層学習の融合

研究代表者

北村 大地 香川高等専門学校, 電気情報工学科, 講師 (40804745)

研究成果

[雑誌論文] Supervised audio source separation based on nonnegative matrix factorization with cosine similarity penalty2022

著者名/発表者名

雑誌名

[雑誌論文] Determined BSS Based on Time-Frequency Masking and Its Application to Harmonic Vector Analysis2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Interactive speech source separation based on independent low-rank matrix analysis2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Joint-diagonalizability-constrained multichannel nonnegative matrix factorization based on time-variant multivariate complex sub-Gaussian distribution2021

著者名/発表者名

雑誌名

DOI

[学会発表] 混合Differentiable DSPモデルによる混合楽器音からの合成パラメータ抽出の実験的評価2022

著者名/発表者名

学会等名

[学会発表] 解像度の異なる複数の時間周波数表現を用いた独立低ランク行列分析2022

著者名/発表者名

学会等名

[学会発表] Deficient basis estimation of noise spatial covariance matrix for rank-constrained spatial covariance matrix estimation method in blind speech extraction2021

著者名/発表者名

学会等名

[学会発表] Linear multichannel blind source separation based on time-frequency mask obtained by harmonic/percussive sound separation2021

著者名/発表者名

学会等名

[学会発表] Independent deeply learned tensor analysis for determined audio source separation2021

著者名/発表者名

学会等名

[学会発表] Empirical Bayesian independent deeply learned matrix analysis for multichannel audio source separation2021

著者名/発表者名

学会等名

[学会発表] Speech enhancement by noise self-supervised rank-constrained spatial covariance matrix estimation via independent deeply learned matrix analysis2021

著者名/発表者名

学会等名

[学会発表] Multichannel audio source separation with independent deeply learned matrix analysis using product of source models2021

著者名/発表者名

学会等名

[学会発表] Prior distribution design for music bleeding-sound reduction based on nonnegative matrix factorization2021

著者名/発表者名

学会等名

[学会発表] 非負値行列因子分解を導入したproduct of experts型音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021

著者名/発表者名

学会等名

[学会発表] 基底共有型非負値行列因子分解を用いた楽器音の音色変換2021

著者名/発表者名

学会等名

[学会発表] 独立低ランク行列分析に基づく音源分離とその発展2021

著者名/発表者名

学会等名

[学会発表] ヘビーテイル生成モデルに基づく独立深層学習テンソル分析2021

著者名/発表者名

学会等名

[学会発表] コサイン類似度罰則条件付き非負値行列因子分解に基づく音源分離の実験的評価2021

著者名/発表者名

学会等名

[学会発表] 独立深層学習行列分析を用いたランク制約付き空間共分散行列推定による音声強調2021

著者名/発表者名

学会等名

[学会発表] Product of Priors型確率分布を導入した音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021

著者名/発表者名

学会等名

[学会発表] 深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化2021

著者名/発表者名

学会等名

[学会発表] 多変量一般化Gauss分布に基づくランク制約付き空間共分散行列推定法における雑音欠落ランク空間基底推定2021

著者名/発表者名

学会等名

[学会発表] 楽譜情報を援用した音楽音響信号に対する混合Differentiable DSPモデルの合成パラメータ推定2021

著者名/発表者名

学会等名

[学会発表] 非負値行列因子分解を用いた被り音の抑圧2021

著者名/発表者名

学会等名

2021 年度実績報告書

北村大地香川高等専門学校, 電気情報工学科, 講師 (40804745)