2023 Fiscal Year Annual Research Report

ニューラルネットワークを用いた統計モデルの学習と音響信号処理への応用

Research Project

Project/Area Number	21K17769
Research Institution	Meiji University
Principal Investigator	丹治寛樹明治大学, 研究・知財戦略機構(生田), 研究推進員(ポスト・ドクター) (40896255)
Project Period (FY)	2021-04-01 – 2024-03-31
Keywords	非負値行列因子分解 / 音源分離 / 雑音除去 / 深層学習 / 深層展開 / 統計モデル
Outline of Annual Research Achievements	音響信号処理において，非負値行列因子分解（NMF）は音響信号のパワースペクトログラムをモデル化するために広く用いられている．音響信号のパワースペクトログラムにNMFの最適化アルゴリズムを適用することでパワースペクトログラムから有用な特徴を抽出できる．研究1年目および2年目では，非負値行列因子分解（NMF）における統計モデルおよび最適化アルゴリズムとして解釈可能なニューラルネットワークを提案した．このネットワークは，NMFの最適化アルゴリズムに現れるモデルに依存する項を学習可能な非線形関数で置き換えることで設計される．提案したネットワーク構造はNMFの最適化アルゴリズムを陽に模擬する一方で，構造内に組み込まれた非線形関数からNMFの統計モデルを取り出すことができる．さらに，研究1年目および2年目では，提案法を雑音除去および教師あり音源分離に適用し，従来の複素分布およびBregman divergenceに基づくNMFの統計モデルの振る舞いを明らかにした．最終年度は，統計モデルに基づく多チャンネル音源分離に着目し，2年目までに得られた知見を基に深層ニューラルネットワーク（DNN）を用いた分離アルゴリズムの拡張を試みた．多チャンネル音源分離は空間情報を活用できる条件下で有用性が知られているものの，DNNを用いた性能の改善方法はDNNの学習の困難さからまだ確立していない．そのため，この研究に2年目までで得られた当該研究課題の知見を活かす試みは大変有意義である． 3年目は，まず，一般化された統計モデルに基づく音源分離のアルゴリズムを導出し，このアルゴリズムが音源情報を必要とするように統計モデルを意図的に調整した．さらに，アルゴリズムに必要な音源情報を事前学習したDNNの出力に置き換えることで分離対象の音源が未知である場合にも対応できることを期待し，事前学習の手法を検討した．

Research Products
(2 results)

All 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (1 results)

[Journal Article] Deep Multiplicative Update Algorithm for Nonnegative Matrix Factorization and Its Application to Audio Signals2023
- Author(s)
  TANJI Hiroki、MURAKAMI Takahiro
- Journal Title
  
  IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  
  Volume: E106.A Pages: 962～975
- DOI
  10.1587/transfun.2022EAP1098
- Peer Reviewed / Open Access
[Presentation] Phase Vocoderを用いた話速変換におけるTransient Smearingの軽減2023
- Author(s)
  八木澤太貴、丹治寛樹、村上隆啓
- Organizer
  第38回信号処理シンポジウム

2023 Fiscal Year Annual Research Report

ニューラルネットワークを用いた統計モデルの学習と音響信号処理への応用

Principal Investigator

丹治 寛樹 明治大学, 研究・知財戦略機構(生田), 研究推進員(ポスト・ドクター) (40896255)

Research Products

[Journal Article] Deep Multiplicative Update Algorithm for Nonnegative Matrix Factorization and Its Application to Audio Signals2023

Author(s)

Journal Title

DOI

[Presentation] Phase Vocoderを用いた話速変換におけるTransient Smearingの軽減2023

Author(s)

Organizer

丹治寛樹明治大学, 研究・知財戦略機構(生田), 研究推進員(ポスト・ドクター) (40896255)