• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

時間領域深層学習と多重解像度解析を融合した音響情景分析の研究

研究課題

研究課題/領域番号 20K19818
研究機関東京大学

研究代表者

中村 友彦  東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)

研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード音響情景分析 / 時間領域深層学習 / 多重解像度解析 / 音源分離 / 音響信号処理 / 深層学習 / 機械学習
研究実績の概要

本年度の成果は以下の通りである.
1. 昨年度まで得られた成果をもとに,離散ウェーブレット変換を用いたダウンサンプリング層を拡張した.昨年度まで主に検討してきた提案層は既存のウェーブレットを用いてきた.しかし,既存のウェーブレットは音源分離のために設計されたものではない.そこで,ウェーブレットと深層ニューラルネットワークの同時学習について検討を行った.同時学習することで,特にモデルサイズが小さい場合に性能が向上するを示した.また,学習中であっても離散ウェーブレット変換がアンチエイリアシングフィルタを持つ条件を求め,それを実際に実現可能な形で導入した層とも比較した.この結果から,この条件を導入することがパラメータ初期化への頑健性を大きく向上させることを示した.それらの研究成果に関して,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,当該論文において第17回日本音響学会・独創研究奨励賞板倉記念を含む2件の賞を受賞した.
2. さらに,多チャネル音源分離への拡張も検討した.具体的には,周波数間の相関を考慮した多チャネル音源分離モデルを実現するため,パワースペクトログラム領域の分離モデルと時間領域での分離モデルを組み合わせる方法を提案した.この時間領域での分離モデルとして,これまで検討してきた音源分離手法を利用することで,分離性能が向上することを示した.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本年度は昨年度の検討を基に離散ウェーブレット変換をベースにした層を拡張し,それらの実験結果をまとめた.その成果は,音響信号処理分野のトップジャーナルであるIEEE/ACM Trans. ASLPに採録された.また,提案法を多チャネル音源分離へと応用した手法も検討しており,当初の計画以上に進展している.

今後の研究の推進方策

来年度は,今年度行った多チャネル音源分離手法への応用の検討を基に,査読付き論文誌への投稿・採択を目指す.

次年度使用額が生じた理由

今年度初頭から夏にかけてCOVID-19の流行が弱まり,国際会議・国内会議の現地開催の可能性もあったものの,冬にかけてのデルタ株,オミクロン株の流行により全てオンライン開催となった.そのため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を
計画していたが,流通悪化による半導体製品の品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.旅費に関しては,当該内容での発表を現地で行うことができるようになったため,その旅費に使用する.また,高性能計算機の購入に関しても次年度に行う予定である.

  • 研究成果

    (9件)

すべて 2021 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (6件) (うち国際学会 2件) 備考 (2件)

  • [雑誌論文] Time-Domain Audio Source Separation With Neural Networks Based on Multiresolution Analysis2021

    • 著者名/発表者名
      Nakamura Tomohiko、Kozuka Shihori、Saruwatari Hiroshi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 29 ページ: 1687~1701

    • DOI

      10.1109/TASLP.2021.3072496

    • 査読あり / オープンアクセス
  • [学会発表] 多重解像度深層分析を用いた楽音分離の実験的評価2021

    • 著者名/発表者名
      中村 友彦、猿渡 洋
    • 学会等名
      音学シンポジウム2021(第131回 音楽情報科学研究会)
  • [学会発表] 周波数領域でのフィルタ設計に基づくサンプリング周波数非依存畳み込み層を用いたDNN音源分離2021

    • 著者名/発表者名
      齋藤 弘一、中村 友彦、矢田部 浩平、猿渡 洋
    • 学会等名
      音学シンポジウム2021(第131回 音楽情報科学研究会)
  • [学会発表] Sampling-frequency-independent Audio Source Separation Using Convolution Layer Based on Impulse Invariant Method2021

    • 著者名/発表者名
      Koichi Saito、Tomohiko Nakamura、Kohei Yatabe、Hiroshi Saruwatari
    • 学会等名
      European Signal Processing Conference 2021
    • 国際学会
  • [学会発表] Independent Deeply Learned Tensor Analysis for Determined Audio Source Separation2021

    • 著者名/発表者名
      Naoki Narisawa、Rintaro Ikeshita、Norihiro Takamune、Daichi Kitamura、Tomohiko Nakamura、Hiroshi Saruwatari、Tomohiro Nakatani
    • 学会等名
      European Signal Processing Conference 2021
    • 国際学会
  • [学会発表] ヘビーテイル生成モデルに基づく独立深層学習テンソル分析2021

    • 著者名/発表者名
      成澤 直輝、池下 林太郎、高宗 典玄、北村 大地、中村 友彦、猿渡 洋、中谷 智広
    • 学会等名
      日本音響学会 2021年秋季研究発表会
  • [学会発表] サンプリング周波数非依存音源分離モデルを用いた楽音分離の実験的評価2021

    • 著者名/発表者名
      齋藤 弘一、中村 友彦、矢田部 浩平、猿渡 洋
    • 学会等名
      日本音響学会 2021年秋季研究発表会
  • [備考] 分離音デモページ

    • URL

      https://tomohikonakamura.github.io/Tomohiko-Nakamura/demo/MRDLA/

  • [備考] 提案手法コード(GitHub)

    • URL

      https://github.com/TomohikoNakamura/dwtls

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi