• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Extended theories of audio source separation based on statistical independence and various mathematical structures

Research Project

Project/Area Number 17H06572
Research InstitutionKagawa National College of Technology

Principal Investigator

北村 大地  香川高等専門学校, 電気情報工学科, 助教 (40804745)

Project Period (FY) 2017-08-25 – 2019-03-31
Keywords音響信号処理 / 統計的信号処理 / 最適化 / 音源分離
Outline of Annual Research Achievements

本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,スマートスピーカーや電話通信,音声認識,補聴器デバイス,音響VR・AR等,多くの応用が期待されている.
平成29年度は,従来より申請者が提案している独立低ランク行列分析(ILRMA)の確率的生成モデルの一般化について,当初の計画通り取り組み,従来のILRMAの利点である高速な最適化・初期値に対する頑健性を保ったまま,より高精度な音源分離結果が得られることを実験的に示した.また,低ランク性以外の性質や,音源にとって適切な性質を学習データと深層学習によって獲得する「独立深層学習行列分析(IDLMA)」を新たに提案した.
平成30年度は,IDLMAのデータ拡張タスクについて取り組んだ.IDLMAにおいて音源モデルを事前に構築するためには,学習データとして完全に分離された音源信号が大量に必要となる.現実的には,そのような学習データを用意できる状況は非常に稀であるため,より少ないデータからその特質を捉え,音響的に適切な制約の下で音源信号を新たに生成する方法について提案した.これは即ち,少数のデータから深層ニューラルネットワークを転移学習する「半教師ありIDLMA」と捉えられる.このような拡張は,より現実の問題解決に即したアルゴリズムといえる.この半教師IDLMAについて実験的に性能を確認したところ,事前学習データを大量に利用する全教師ありIDLMAと同程度の音源分離が達成できることを確認した.これらの成果については,現在論文を投稿中である.

Research Progress Status

平成30年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

平成30年度が最終年度であるため、記入しない。

  • Research Products

    (29 results)

All 2019 2018 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (24 results) (of which Int'l Joint Research: 9 results,  Invited: 1 results) Remarks (2 results)

  • [Journal Article] Bilevel Optimization Using Stationary Point of Lower-level Objective Function for Discriminative Basis Learning in Nonnegative Matrix Factorization2019

    • Author(s)
      Nakajima Hiroaki、Kitamura Daichi、Takamune Norihiro、Saruwatari Hiroshi、Ono Nobutaka
    • Journal Title

      IEEE Signal Processing Letters

      Volume: 印刷中 Pages: 印刷中

    • DOI

      10.1109/LSP.2019.2909079

    • Peer Reviewed / Open Access
  • [Journal Article] Independent Low-Rank Matrix Analysis Based on Generalized Kullback-Leibler Divergence2019

    • Author(s)
      MOGAMI Shinichi、MITSUI Yoshiki、TAKAMUNE Norihiro、KITAMURA Daichi、SARUWATARI Hiroshi、TAKAHASHI Yu、KONDO Kazunobu、NAKAJIMA Hiroaki、KAMEOKA Hirokazu
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E102.A Pages: 458~463

    • DOI

      10.1587/transfun.E102.A.458

    • Peer Reviewed / Open Access
  • [Journal Article] Generalized independent low-rank matrix analysis using heavy-tailed distributions for blind source separation2018

    • Author(s)
      Kitamura Daichi、Mogami Shinichi、Mitsui Yoshiki、Takamune Norihiro、Saruwatari Hiroshi、Ono Nobutaka、Takahashi Yu、Kondo Kazunobu
    • Journal Title

      EURASIP Journal on Advances in Signal Processing

      Volume: 2018 Pages: 1~28

    • DOI

      10.1186/s13634-018-0549-5

    • Peer Reviewed / Open Access
  • [Presentation] Generalized-Gaussian-distribution-based independent deeply learned matrix analysis for multichannel audio source separation2019

    • Author(s)
      Naoki Makishima, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari, Yu Takahashi, Kazunobu Kondo, and Hiroaki Nakajima
    • Organizer
      Proceedings of International Congress and Exhibition on Noise Control Engineering (INTERNOISE 2019)
    • Int'l Joint Research
  • [Presentation] Column-wise update algorithm for independent deeply learned matrix analysis2019

    • Author(s)
      Naoki Makishima, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari, Yu Takahashi, and Kazunobu Kondo,
    • Organizer
      Proceedings of International Congress on Acoustics (ICA 2019)
    • Int'l Joint Research
  • [Presentation] Time-frequency-masking-based determined BSS with application to sparse IVA2019

    • Author(s)
      Kohei Yatabe and Daichi Kitamura
    • Organizer
      Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
    • Int'l Joint Research
  • [Presentation] 収束保証型独立半正定値テンソル分析に基づくブラインド音源分離2019

    • Author(s)
      福重敢太, 高宗典玄, 北村大地, 猿渡洋, 池下林太郎, 中谷智広
    • Organizer
      IEICE Technical Report, EA2018-127
  • [Presentation] ブラインド音源分離における多変量複素Student's t分布に基づくランク制約付き空間共分散モデルの推定2019

    • Author(s)
      久保優騎, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      IEICE Technical Report, EA2018-128
  • [Presentation] 時変複素一般化ガウス分布に基づく独立深層学習行列分析2019

    • Author(s)
      牧島直輝, 高宗典玄, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明
    • Organizer
      日本音響学会 2019年春季研究発表会講演論文集
  • [Presentation] 乗算型更新式に基づくランク制約付き空間共分散モデルの推定2019

    • Author(s)
      久保優騎, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      日本音響学会 2019年春季研究発表会講演論文集
  • [Presentation] 独立低ランク行列分析におけるmajorization-equalizationアルゴリズムを用いた空間パラメータの高速更新2019

    • Author(s)
      最上伸一, 高宗典玄, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明
    • Organizer
      日本音響学会 2019年春季研究発表会講演論文集
  • [Presentation] 白色化の影響を考慮したスパース独立ベクトル分析2019

    • Author(s)
      矢田部浩平, 北村大地
    • Organizer
      日本音響学会 2019年春季研究発表会講演論文集
  • [Presentation] 教師あり及び半教師あり条件下における独立深層学習行列分析の実験的評価2019

    • Author(s)
      牧島直輝, 最上伸一, 高宗典玄, 高道慎之介, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明
    • Organizer
      日本音響学会 2019年春季研究発表会講演論文集
  • [Presentation] Independent low-rank matrix analysis based on time-variant sub-Gaussian source model2018

    • Author(s)
      Shinichi Mogami, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari, Yu Takahashi, Kazunobu Kondo, Hiroaki Nakajima, and Nobutaka Ono
    • Organizer
      Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2018)
    • Int'l Joint Research
  • [Presentation] Generative approach using the noise generation models for DNN-based speech synthesis trained from noisy speech2018

    • Author(s)
      Masakazu Une, Yuki Saito, Shinnosuke Takamichi, Daichi Kitamura, Ryoichi Miyazaki, and Hiroshi Saruwatari
    • Organizer
      Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2018)
    • Int'l Joint Research / Invited
  • [Presentation] Phase reconstruction from amplitude spectrograms based on von-Mises-distribution deep neural network2018

    • Author(s)
      Shinnosuke Takamichi, Yuki Saito, Norihiro Takamune, Daichi Kitamura, and Hiroshi Saruwatari
    • Organizer
      Proceedings of International Workshop on Acoustic Signal Enhancement (IWAENC 2018)
    • Int'l Joint Research
  • [Presentation] Independent deeply learned matrix analysis for multichannel audio source separation2018

    • Author(s)
      Shinichi Mogami, Hayato Sumino, Daichi Kitamura, Norihiro Takamune, Shinnosuke Takamichi, Hiroshi Saruwatari, and Nobutaka Ono
    • Organizer
      Proceedings of European Signal Processing Conference (EUSIPCO 2018)
    • Int'l Joint Research
  • [Presentation] Determined blind source separation via proximal splitting algorithm2018

    • Author(s)
      Kohei Yatabe and Daichi Kitamura
    • Organizer
      Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018)
    • Int'l Joint Research
  • [Presentation] Vectorwise coordinate descent algorithm for spatially regularized independent low-rank matrix analysis2018

    • Author(s)
      Yoshiki Mitsui, Norihiro Takamune, Daichi Kitamura, Hiroshi Saruwatari, Yu Takahashi, and Kazunobu Kondo
    • Organizer
      Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018)
    • Int'l Joint Research
  • [Presentation] ヘビーテイル生成モデルに基づく独立深層学習行列分析による多チャネル音源分離2018

    • Author(s)
      牧島直輝, 最上伸一, 高宗典玄, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明
    • Organizer
      Proceedings of 33th Signal Processing Symposium (SIP Symposium)
  • [Presentation] 方向統計DNNに基づく振幅スペクトログラムからの位相復元2018

    • Author(s)
      高道慎之介, 齋藤佑樹, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      日本音響学会 2018年秋季研究発表会講演論文集
  • [Presentation] 一般化反復射影法に基づく時変劣ガウス独立低ランク行列分析2018

    • Author(s)
      最上伸一, 高宗典玄, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明, 小野順貴
    • Organizer
      日本音響学会 2018年秋季研究発表会講演論文集
  • [Presentation] 独立低ランク行列分析を用いたフルランク空間共分散モデルに基づくブラインド音源分離2018

    • Author(s)
      久保優騎, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      日本音響学会 2018年秋季研究発表会講演論文集
  • [Presentation] 半教師あり独立深層学習行列分析におけるデータ拡張に基づく音源モデルの適応2018

    • Author(s)
      牧島直輝, 高宗典玄, 高道慎之介, 北村大地, 猿渡洋, 高橋祐, 近藤多伸, 中嶋広明
    • Organizer
      日本音響学会 2018年秋季研究発表会講演論文集
  • [Presentation] 一般の時間周波数マスキングに基づく独立ベクトル分析2018

    • Author(s)
      矢田部浩平, 北村大地
    • Organizer
      日本音響学会 2018年秋季研究発表会講演論文集
  • [Presentation] 雑音下異常検知における前処理としてのNMF音源抽出手法の検討2018

    • Author(s)
      相場亮人, 吉田実, 後藤理, 北村大地, 高道慎之介, 猿渡洋
    • Organizer
      Proceedings of 119th IPSJ Special Interest Group on Music and Computer (IPSJ-SIGMUS)
  • [Presentation] von Mises分布DNNに基づく振幅スペクトログラムからの位相復元2018

    • Author(s)
      高道慎之介, 齋藤佑樹, 高宗典玄, 北村大地, 猿渡洋
    • Organizer
      Proceedings of 119th IPSJ Special Interest Group on Music and Computer (IPSJ-SIGMUS)
  • [Remarks] 独立深層学習行列分析に基づく多チャネル音源分離

    • URL

      http://d-kitamura.net/demo_idlma.htm

  • [Remarks] Audio Source Separation Based on IDLMA

    • URL

      http://d-kitamura.net/en/demo_idlma_en.htm

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi