• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

あらゆる音の定位・分離・分類のためのユニバーサル音響理解モデル

Research Project

Project/Area Number 20K21813
Research InstitutionKyoto University

Principal Investigator

吉井 和佳  京都大学, 情報学研究科, 准教授 (20510001)

Project Period (FY) 2020-07-30 – 2022-03-31
Keywords音響信号処理 / 音源分離 / 残響除去
Outline of Annual Research Achievements

2020年度は、任意の音源・空間特性を表現可能なユニバーサル音響生成モデルの定式化に取り組んだ。具体的には、音源スペクトログラムの時間周波数構造を示す音源モデルと、音源からマイクアレイへの信号伝達特性を示す空間モデルを内包する多チャネル音響信号の統一的な生成モデル(例:多チャネル非負値行列因子分解, MNMF)に基づくブラインド音源分離法に関して、深層生成モデルを用いて空間モデルおよび音源モデルそれぞれの表現力を飛躍的に向上させることに成功した。まず、変分自己符号化器 (VAE) を用いて、クリーンな音声信号のみから音声スペクトログラムの深層生成モデルを学習する方式を洗練化した。また、マイク数と音源数が等しい決定条件下において、正規化フロー (NF) に基づく時変な分離行列の構成法を考案した。これらの方法はそれぞれ独立しており、理論的には組み合わせて使うことが可能である。深層学習を用いない本質的な拡張として、MNMFの初期値依存性を軽減するため、空間モデルにおける空間相関行列を同時対角化できるものに制限したFastMNMFを考案した。また、雑音および残響が存在する実環境下で頑健に動作させるため、FastMNMFに対し、自己回帰移動平均 (ARMA) 過程に基づく残響モデルを統合することで、同時的ブラインド音源分離・残響除去法であるARMA-FastMNMFを考案した。また、カテゴリ創発機構を有するユニバーサル音響理解モデルを確立するため、必要に応じた個数の音源を推定可能な深層ノンパラメトリックベイズ学習法の研究に着手した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

計算量・精度の両面で優れた汎用ブラインド音源分離手法であるFastMNMFの開発に成功した。また、残響除去を統合することに成功した。

Strategy for Future Research Activity

今後は、カテゴリ創発に関する研究開発を進めていく。また、視覚情報の統合についても検討を行う。

Causes of Carryover

新型コロナウイルス感染症の拡大により、人件費および旅費の支出が当初の想定と異なり、繰り越しが生じた。2021年度は、国内外の会議が現地開催されることも想定しつつ、費目流用の範囲内で、音響デバイスや計算機などの物品費を中心に支出予定である。

  • Research Products

    (4 results)

All 2021 2020

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (2 results)

  • [Journal Article] Fast Multichannel Nonnegative Matrix Factorization With Directivity-Aware Jointly-Diagonalizable Spatial Covariance Matrices for Blind Source Separation2020

    • Author(s)
      Kouhei Sekiguchi, Yoshiaki Bando, Aditya Arie Nugraha, Kazuyoshi Yoshii, Tatsuya Kawahara
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 28 Pages: 2610~2625

    • DOI

      10.1109/TASLP.2020.3019181

    • Peer Reviewed / Open Access
  • [Journal Article] Flow-Based Independent Vector Analysis for Blind Source Separation2020

    • Author(s)
      Aditya Arie Nugraha, Kouhei Sekiguchi, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii
    • Journal Title

      IEEE Signal Processing Letters

      Volume: 27 Pages: 2173~2177

    • DOI

      10.1109/LSP.2020.3039944

    • Peer Reviewed / Open Access
  • [Presentation] ARMA-FastMNMFに基づく同時的ブラインド音源分離・残響除去2021

    • Author(s)
      関口 航平, 坂東 宜昭, Aditya Arie Nugraha, Mathieu Fontaine, 吉井 和佳
    • Organizer
      日本音響学会 2021年春季研究発表会
  • [Presentation] NF-IVAに基づく線形時変型決定系ブラインド音源分離2021

    • Author(s)
      Aditya Arie Nugraha, 関口 航平, Mathieu Fontaine, 坂東 宜昭, 吉井 和佳
    • Organizer
      日本音響学会 2021年春季研究発表会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi