• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

時間領域深層学習と多重解像度解析を融合した音響情景分析の研究

Research Project

Project/Area Number 20K19818
Research InstitutionThe University of Tokyo

Principal Investigator

中村 友彦  東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)

Project Period (FY) 2020-04-01 – 2023-03-31
Keywords音響情景分析 / 時間領域深層学習 / 多重解像度解析
Outline of Annual Research Achievements

本年度の成果は以下の通りである.
1. 時間領域深層ニューラルネットワークと多重解像度解析の構造の類似性に着眼し,信号処理の知見を融合した深層ニューラルネットワークの構築に向け検討を行った.従来の多くの深層学習モデルでは,特徴量が間引き操作によってダウンサンプリングされており,エイリアシングや情報の欠落が特徴量領域で起こりうる.これらの問題を同時に解決するため提案された離散ウェーブレット変換を用いたダウンサンプリング層に関して,実装にリフティングスキームと呼ばれる技法を用いることで,様々なウェーブレット基底関数を使用可能であることを示した.これにより,ウェーブレットから定まるローパス,ハイパスフィルタの周波数特性を容易に変更可能となり,これらの周波数特性と音源分離性能の間の関係性を調査できるようになった.また,深層ニューラルネットワークとウェーブレットの同時学習についても理論的検討を進めている.
2. 上述の取り組みを推し進め,信号処理の基本的に概念の1つであるサンプリング周波数に対して信号処理の知見と深層学習モデルを融合した手法の初期検討を行った.深層学習で使われる畳み込み層は信号処理で使われるデジタルフィルタとみなせることを発見した.これに着眼し,アナログフィルタからデジタルフィルタを設計する手法を畳み込み層の重みの生成過程として導入することで,サンプリング周波数に不変な構造を背後にもつ畳み込み層を構築できることを示した.この構造により,学習に用いていないサンプリング周波数についても,学習したサンプリング周波数と同等の分離性能が達成できることを実験により確認した.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本年度は,主に離散ウェーブレット変換をベースにした層の理論部分を整備することができた.また,深層ニューラルネットワークとウェーブレットの同時学習に関しても理論的検討に入っており,順調に進展している.さらに,これらの手法に通底するアイディアを発展させ,サンプリング周波数不変な畳み込み層の初期検討にも着手しており,当初の計画以上に進展している.

Strategy for Future Research Activity

来年度は,今年度行った提案層に関する理論的検討を踏まえ,様々なパラメータや実験条件での提案法の音源分離性能に関して詳細な調査を行い,査読付き論文誌への採択を目指す.また,他のアプリケーションへの適用可能性についても調査する.

Causes of Carryover

今年度は,COVID-19の流行による国際会議・国内会議が全てオンライン開催となったため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を計画していたが,流通悪化やマイニング需要によるGPUの品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.現在も価格の高騰が続いているため,GPUクラウドサービスの利用も視野に入れつつ,次年度での高性能計算機の購入を検討する.

  • Research Products

    (4 results)

All 2021 2020

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (3 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Harmonic-Temporal Factor Decomposition for Unsupervised Monaural Separation of Harmonic Sounds2021

    • Author(s)
      Nakamura Tomohiko、Kameoka Hirokazu
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 29 Pages: 68~82

    • DOI

      10.1109/TASLP.2020.3037487

    • Peer Reviewed / Open Access
  • [Presentation] 潜在アナログフィルタ表現に基づく畳み込み層を用いたサンプリング周波数非依存なDNN音源分離2021

    • Author(s)
      齋藤 弘一, 中村 友彦, 矢田部 浩平, 小泉 悠馬, 猿渡 洋
    • Organizer
      日本音響学会2021年春季研究発表会
  • [Presentation] アンチエイリアシング機構を導入したサンプリング周波数非依存な畳み込み層を用いた音源分離2021

    • Author(s)
      齋藤 弘一, 中村 友彦, 矢田部 浩平, 小泉 悠馬, 猿渡 洋
    • Organizer
      情報処理学会 第130回音楽情報科学研究会
  • [Presentation] Investigation on Wavelet Basis Function of DNN-based Time Domain Audio Source Separation Inspired by Multiresolution Analysis2020

    • Author(s)
      Shihori Kozuka, Tomohiko Nakamura, Hiroshi Saruwatari
    • Organizer
      49th International Congress and Exposition on Noise Control Engineering
    • Int'l Joint Research

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi