• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Unification of Deep Learning and Generalized Mathematical Model for Independence-Based Audio Source Separation

Research Project

Project/Area Number 19K20306
Research InstitutionKagawa National College of Technology

Principal Investigator

北村 大地  香川高等専門学校, 電気情報工学科, 講師 (40804745)

Project Period (FY) 2019-04-01 – 2022-03-31
Keywords音源分離 / 補聴器 / 深層学習 / アレイ信号処理
Outline of Annual Research Achievements

本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,多くの応用が期待されている.具体的には,音響信号を対象とした音源分離の数理的深化と高性能化を目的として,申請者が過去に提案した手法である「独立低ランク行列分析(ILRMA)」を数理的に一般化した新しい音源分離フレームワークを確立する.これは「音源間の統計的独立性と各音源の構造に関する制約条件」という新たな考え方であり,いかに適切な音源構造制約を与えるかについて,数理的・データ的観点から発展させる.具体的には「一般化ガウス分布生成モデル」と「音源モデルplug-andplayな最適化法」の理論解析と確立,「深層学習に基づく音源教師あり手法」への発展,「ユーザの介入を組み合わせたインタラクティブ音源分離手法」の開発の3点を目標とする.
3年目である令和3年度は,「音源モデルのplug-and-playが可能な最適化法」について計画通り進めることができ,その効果が認められトップジャーナルへの採録・掲載に至った.さらに,この手法の応用として,調波打楽器音分離(HPSS)を音源モデルとした時間周波数マスクに基づくブラインド音源分離についても,トップカンファレンスでの発表を実施し,さらにより詳細な実験を追加してジャーナルに投稿できた.これらは,申請者が掲げる全ての研究計画が予定通りに実施されたことによる成果であった.

  • Research Products

    (26 results)

All 2022 2021

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Open Access: 4 results) Presentation (22 results) (of which Int'l Joint Research: 7 results,  Invited: 1 results)

  • [Journal Article] Supervised audio source separation based on nonnegative matrix factorization with cosine similarity penalty2022

    • Author(s)
      Yuta Iwase and Daichi Kitamura
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E105-A (6) Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] Determined BSS Based on Time-Frequency Masking and Its Application to Harmonic Vector Analysis2021

    • Author(s)
      Yatabe Kohei、Kitamura Daichi
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 29 Pages: 1609~1625

    • DOI

      10.1109/TASLP.2021.3073863

    • Peer Reviewed / Open Access
  • [Journal Article] Interactive speech source separation based on independent low-rank matrix analysis2021

    • Author(s)
      Oshima Fuga、Nakano Masaki、Kitamura Daichi
    • Journal Title

      Acoustical Science and Technology

      Volume: 42 Pages: 222~225

    • DOI

      10.1250/ast.42.222

    • Peer Reviewed / Open Access
  • [Journal Article] Joint-diagonalizability-constrained multichannel nonnegative matrix factorization based on time-variant multivariate complex sub-Gaussian distribution2021

    • Author(s)
      Kamo Keigo、Mitsui Yoshiki、Kubo Yuki、Takamune Norihiro、Kitamura Daichi、Saruwatari Hiroshi、Takahashi Yu、Kondo Kazunobu
    • Journal Title

      Signal Processing

      Volume: 188 Pages: 108183~108183

    • DOI

      10.1016/j.sigpro.2021.108183

    • Peer Reviewed / Open Access
  • [Presentation] 混合Differentiable DSPモデルによる混合楽器音からの合成パラメータ抽出の実験的評価2022

    • Author(s)
      川村真也, 中村友彦, 北村大地, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      日本音響学会 2022年春季研究発表会
  • [Presentation] 解像度の異なる複数の時間周波数表現を用いた独立低ランク行列分析2022

    • Author(s)
      細谷泰稚, 北村大地, 矢田部浩平
    • Organizer
      日本音響学会 2022年春季研究発表会
  • [Presentation] Deficient basis estimation of noise spatial covariance matrix for rank-constrained spatial covariance matrix estimation method in blind speech extraction2021

    • Author(s)
      Yuto Kondo, Yuki Kubo, Norihiro Takamune, Daichi Kitamura, and Hiroshi Saruwatari
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)
    • Int'l Joint Research
  • [Presentation] Linear multichannel blind source separation based on time-frequency mask obtained by harmonic/percussive sound separation2021

    • Author(s)
      Soichiro Oyabu, Daichi Kitamura, and Kohei Yatabe
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)
    • Int'l Joint Research
  • [Presentation] Independent deeply learned tensor analysis for determined audio source separation2021

    • Author(s)
      Naoki Narisawa, Rintaro Ikeshita, Norihiro Takamune, Daichi Kitamura, Tomohiko Nakamura, Hiroshi Saruwatari, and Tomohiro Nakatani
    • Organizer
      European Signal Processing Conference (EUSIPCO 2021)
    • Int'l Joint Research
  • [Presentation] Empirical Bayesian independent deeply learned matrix analysis for multichannel audio source separation2021

    • Author(s)
      Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, and Kazunobu Kondo
    • Organizer
      European Signal Processing Conference (EUSIPCO 2021)
    • Int'l Joint Research
  • [Presentation] Speech enhancement by noise self-supervised rank-constrained spatial covariance matrix estimation via independent deeply learned matrix analysis2021

    • Author(s)
      Sota Misawa, Norihiro Takamune, Tomohiko Nakamura, Daichi Kitamura, Hiroshi Saruwatari, Masakazu Une, and Shoji Makino
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
    • Int'l Joint Research
  • [Presentation] Multichannel audio source separation with independent deeply learned matrix analysis using product of source models2021

    • Author(s)
      Takuya Hasumi, Tomohiko Nakamura, Norihiro Takamune, Hiroshi Saruwatari, Daichi Kitamura, Yu Takahashi, and Kazunobu Kondo
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
    • Int'l Joint Research
  • [Presentation] Prior distribution design for music bleeding-sound reduction based on nonnegative matrix factorization2021

    • Author(s)
      Yusaku Mizobuchi, Daichi Kitamura, Tomohiko Nakamura, Hiroshi Saruwatari, Yu Takahashi, and Kazunobu Kondo
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2021)
    • Int'l Joint Research
  • [Presentation] 非負値行列因子分解を導入したproduct of experts型音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021

    • Author(s)
      蓮実拓也, 中村友彦, 高宗典玄, 猿渡洋, 北村大地, 高橋祐, 近藤多伸
    • Organizer
      情報処理学会 第131回音楽情報科学研究会
  • [Presentation] 基底共有型非負値行列因子分解を用いた楽器音の音色変換2021

    • Author(s)
      北村大地, 香西海斗
    • Organizer
      情報処理学会 第131回音楽情報科学研究会
  • [Presentation] 独立低ランク行列分析に基づく音源分離とその発展2021

    • Author(s)
      北村大地
    • Organizer
      電子情報通信学会 信号処理研究会
    • Invited
  • [Presentation] ヘビーテイル生成モデルに基づく独立深層学習テンソル分析2021

    • Author(s)
      成澤直輝, 池下林太郎, 高宗典玄, 北村大地, 中村友彦, 猿渡洋, 中谷智広
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] コサイン類似度罰則条件付き非負値行列因子分解に基づく音源分離の実験的評価2021

    • Author(s)
      岩瀬佑太, 北村大地
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] 独立深層学習行列分析を用いたランク制約付き空間共分散行列推定による音声強調2021

    • Author(s)
      三澤颯大, 中村友彦, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] Product of Priors型確率分布を導入した音源モデルに基づく独立深層学習行列分析による多チャネル音源分離2021

    • Author(s)
      蓮実拓也, 中村友彦, 高宗典玄, 猿渡洋, 北村大地, 高橋祐, 近藤多伸
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] 深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化2021

    • Author(s)
      渡辺瑠伊, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] 多変量一般化Gauss分布に基づくランク制約付き空間共分散行列推定法における雑音欠落ランク空間基底推定2021

    • Author(s)
      近藤祐斗, 久保優騎, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      日本音響学会 2021年秋季研究発表会
  • [Presentation] 楽譜情報を援用した音楽音響信号に対する混合Differentiable DSPモデルの合成パラメータ推定2021

    • Author(s)
      川村真也, 中村友彦, 北村大地, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      情報処理学会 第132回音楽情報科学研究会(夏のシンポジウム)
  • [Presentation] 非負値行列因子分解を用いた被り音の抑圧2021

    • Author(s)
      溝渕悠朔, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      情報処理学会 第132回音楽情報科学研究会(夏のシンポジウム)
  • [Presentation] コサイン類似度罰則条件付き非負値行列因子分解に基づく音源分離の仮説検定2021

    • Author(s)
      岩瀬佑太, 北村大地
    • Organizer
      第24回 日本音響学会関西支部 若手研究者交流研究発表会
  • [Presentation] 深層学習に基づく周波数帯域予測による高速音源分離法の実験的評価2021

    • Author(s)
      渡辺瑠伊, 北村大地, 中村友彦, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      第24回 日本音響学会関西支部 若手研究者交流研究発表会

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi