• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

時間領域深層学習と多重解像度解析を融合した音響情景分析の研究

研究課題

研究課題/領域番号 20K19818
研究機関東京大学

研究代表者

中村 友彦  東京大学, 大学院情報理工学系研究科, 特任助教 (50866308)

研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード音響情景分析 / 時間領域深層学習 / 多重解像度解析
研究実績の概要

本年度の成果は以下の通りである.
1. 時間領域深層ニューラルネットワークと多重解像度解析の構造の類似性に着眼し,信号処理の知見を融合した深層ニューラルネットワークの構築に向け検討を行った.従来の多くの深層学習モデルでは,特徴量が間引き操作によってダウンサンプリングされており,エイリアシングや情報の欠落が特徴量領域で起こりうる.これらの問題を同時に解決するため提案された離散ウェーブレット変換を用いたダウンサンプリング層に関して,実装にリフティングスキームと呼ばれる技法を用いることで,様々なウェーブレット基底関数を使用可能であることを示した.これにより,ウェーブレットから定まるローパス,ハイパスフィルタの周波数特性を容易に変更可能となり,これらの周波数特性と音源分離性能の間の関係性を調査できるようになった.また,深層ニューラルネットワークとウェーブレットの同時学習についても理論的検討を進めている.
2. 上述の取り組みを推し進め,信号処理の基本的に概念の1つであるサンプリング周波数に対して信号処理の知見と深層学習モデルを融合した手法の初期検討を行った.深層学習で使われる畳み込み層は信号処理で使われるデジタルフィルタとみなせることを発見した.これに着眼し,アナログフィルタからデジタルフィルタを設計する手法を畳み込み層の重みの生成過程として導入することで,サンプリング周波数に不変な構造を背後にもつ畳み込み層を構築できることを示した.この構造により,学習に用いていないサンプリング周波数についても,学習したサンプリング周波数と同等の分離性能が達成できることを実験により確認した.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本年度は,主に離散ウェーブレット変換をベースにした層の理論部分を整備することができた.また,深層ニューラルネットワークとウェーブレットの同時学習に関しても理論的検討に入っており,順調に進展している.さらに,これらの手法に通底するアイディアを発展させ,サンプリング周波数不変な畳み込み層の初期検討にも着手しており,当初の計画以上に進展している.

今後の研究の推進方策

来年度は,今年度行った提案層に関する理論的検討を踏まえ,様々なパラメータや実験条件での提案法の音源分離性能に関して詳細な調査を行い,査読付き論文誌への採択を目指す.また,他のアプリケーションへの適用可能性についても調査する.

次年度使用額が生じた理由

今年度は,COVID-19の流行による国際会議・国内会議が全てオンライン開催となったため,旅費が生じなかった.また,GPUを複数積んだ高性能計算機の導入を計画していたが,流通悪化やマイニング需要によるGPUの品薄状態が続き価格が高騰したため,予定していた計算機の購入が難しく今年度の購入に至らなかった.現在も価格の高騰が続いているため,GPUクラウドサービスの利用も視野に入れつつ,次年度での高性能計算機の購入を検討する.

  • 研究成果

    (4件)

すべて 2021 2020

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] Harmonic-Temporal Factor Decomposition for Unsupervised Monaural Separation of Harmonic Sounds2021

    • 著者名/発表者名
      Nakamura Tomohiko、Kameoka Hirokazu
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 29 ページ: 68~82

    • DOI

      10.1109/TASLP.2020.3037487

    • 査読あり / オープンアクセス
  • [学会発表] 潜在アナログフィルタ表現に基づく畳み込み層を用いたサンプリング周波数非依存なDNN音源分離2021

    • 著者名/発表者名
      齋藤 弘一, 中村 友彦, 矢田部 浩平, 小泉 悠馬, 猿渡 洋
    • 学会等名
      日本音響学会2021年春季研究発表会
  • [学会発表] アンチエイリアシング機構を導入したサンプリング周波数非依存な畳み込み層を用いた音源分離2021

    • 著者名/発表者名
      齋藤 弘一, 中村 友彦, 矢田部 浩平, 小泉 悠馬, 猿渡 洋
    • 学会等名
      情報処理学会 第130回音楽情報科学研究会
  • [学会発表] Investigation on Wavelet Basis Function of DNN-based Time Domain Audio Source Separation Inspired by Multiresolution Analysis2020

    • 著者名/発表者名
      Shihori Kozuka, Tomohiko Nakamura, Hiroshi Saruwatari
    • 学会等名
      49th International Congress and Exposition on Noise Control Engineering
    • 国際学会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi