• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音環境の認識と理解のための革新的マイクロホンアレー基盤技術の深化

研究課題

研究課題/領域番号 23K28113
補助金の研究課題番号 23H03423 (2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2023)
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関早稲田大学

研究代表者

牧野 昭二  早稲田大学, 理工学術院(情報生産システム研究科・センター), 特任教授 (60396190)

研究分担者 山田 武志  筑波大学, システム情報系, 教授 (20312829)
猿渡 洋  東京大学, 大学院情報理工学系研究科, 教授 (30324974)
研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
18,590千円 (直接経費: 14,300千円、間接経費: 4,290千円)
2025年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2024年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2023年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
キーワード音響情報処理 / 音響信号処理 / マイクロホンアレー / 音環境の認識と理解
研究開始時の研究の概要

1) 音源分離・雑音抑圧・残響除去の統合技術を開発する。
2) 音源分離と時間周波数スイッチングフィルタを融合させ、劣決定/優決定条件の全体を最適化した理論を構築する。
3) 弱ラベル・ラベル無し学習法を開発し、ビッグデータのラベル付けコストの大幅削減を達成する。

研究実績の概要

[検討項目1][音源分離・雑音抑圧・残響除去の統合および移動音源への対応]
これまで異なるアプローチで個別に発展してきた音源分離・雑音抑圧・残響除去を同一の誤差関数の最小化問題として統合し、同時最適化する統合手法を開発した。そして、時間周波数スイッチングフィルタを用いたマイクロホンアレーに対応できるように一般化し、更に強力な最適化規範を導入した。今期は、雑誌論文4件、国際会議発表4件、および国内大会発表2件の研究成果を得た。
[検討項目2][時間周波数スイッチングフィルタの複素フィルタとしての新展開]
時間周波数スイッチングビームフォーマは、複素フィルタを用いてマイク間の位相差を制御して空間指向性を形成していた。この概念を音源分離・雑音抑圧・残響除去に展開した時間周波数スイッチングフィルタにより、音源数に依存することなく高品質な出力を得るための統一的なアレー信号処理を検討した。時間周波数スイッチングフィルタを音源分離・雑音抑圧・残響除去の統合手法と融合させ、優決定問題 (音源数 < マイク数) と劣決定問題 (マイク数 < 音源数) の両方に対応できる手法を構築した。今期は、雑誌論文2件および国際会議発表1件の研究成果を得た。
[検討項目3][音環境の理解およびユニバーサル・サウンド・セパレーション]
ロボットの耳などを想定し、世界中にあるすべての音を対象とするユニバーサル・サウンド・セパレーションを検討した。強調された音源信号から抽出した特徴量に基づき、音環境を解析・理解した。分類精度を向上させるために、言語情報と音情報のマルチモーダルの活用法や敵対的生成ネットワーク(Generative Adversarial Networks: GAN)などの深層学習の最新の音声認識技術も検討した。今期は、国際会議発表2件および国内大会発表3件の研究成果を得た。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究は順調に進展し、雑誌論文6件、国際会議発表7件、国内大会発表5件の研究成果を得た。

今後の研究の推進方策

[検討項目1][音源分離・雑音抑圧・残響除去の統合および移動音源への対応]
これまで異なるアプローチで個別に発展してきた音源分離・雑音抑圧・残響除去を同一の誤差関数の最小化問題として統合し、同時最適化する統合手法を開発する。そして、時間周波数スイッチングフィルタを用いたマイクロホンアレーに対応できるように一般化し、更に強力な最適化規範を導入する。更に、演算量を削減しながら、性能を最適化するための実時間動作実現手法も検討する。
[検討項目2][時間周波数スイッチングフィルタの複素フィルタとしての新展開]
時間周波数スイッチングビームフォーマは、複素フィルタを用いてマイク間の位相差を制御して空間指向性を形成していた。この概念を音源分離・雑音抑圧・残響除去に展開した時間周波数スイッチングフィルタにより、音源数に依存することなく高品質な出力を得るための統一的なアレー信号処理を検討する。時間周波数スイッチングフィルタを音源分離・雑音抑圧・残響除去の統合手法と融合させ、優決定問題 (音源数 < マイク数) と劣決定問題 (マイク数 < 音源数) の両方に対応できる手法を構築する。
[検討項目3][音環境の理解およびユニバーサル・サウンド・セパレーション]
ロボットの耳などを想定し、世界中にあるすべての音を対象とするユニバーサル・サウンド・セパレーションを検討する。強調された音源信号から抽出した特徴量に基づき、音環境を解析・理解する。音源信号に関する先見知識を利用し、音源の種類の増大に対処するため、言葉によるラベルを与えて補助する方式を検討する。特徴量次元での分類法も利用する。分類精度を向上させるために、言語情報と音情報のマルチモーダルの活用法や敵対的生成ネットワーク(Generative Adversarial Networks: GAN)などの深層学習の最新の音声認識技術も検討する。

報告書

(1件)
  • 2023 実績報告書
  • 研究成果

    (18件)

すべて 2024 2023

すべて 雑誌論文 (6件) (うち国際共著 1件、 査読あり 6件、 オープンアクセス 6件) 学会発表 (12件) (うち国際学会 7件、 招待講演 2件)

  • [雑誌論文] Blind and spatially-regularized online joint optimization of source separation, dereverberation, and noise reduction2024

    • 著者名/発表者名
      T. Ueda, T. Nakatani, R. Ikeshita, K. Kinoshita, S. Araki, and S. Makino
    • 雑誌名

      IEEE/ACM Trans. Audio, Speech and Language Processing

      巻: vol. 32 ページ: 1157-1172

    • DOI

      10.1109/taslp.2024.3351353

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Real-Time Moving Blind Source Extraction Based on Constant Separating Vector and Auxiliary Function Technique2023

    • 著者名/発表者名
      S. Yuan, T. Ueda, and S. Makino
    • 雑誌名

      信号処理

      巻: 27 号: 4 ページ: 81-85

    • DOI

      10.2299/jsp.27.81

    • ISSN
      1342-6230, 1880-1013
    • 年月日
      2023-07-01
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Deep Complex-Valued Neural Network-Based Triple-Path Mask and Steering Vector Estimation for Multichannel Target Speech Separation2023

    • 著者名/発表者名
      M. Qin, L. Li, and S. Makino
    • 雑誌名

      信号処理

      巻: 27 号: 4 ページ: 87-91

    • DOI

      10.2299/jsp.27.87

    • ISSN
      1342-6230, 1880-1013
    • 年月日
      2023-07-01
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Audio signal processing in the 21st century2023

    • 著者名/発表者名
      G. Richard, P. Smaragdis, S. Gannot, P. Naylor, S. Makino, W. Kellermann, and A. Sugiyama
    • 雑誌名

      IEEE Signal Processing Magazine

      巻: vol. 40 号: 5 ページ: 12-26

    • DOI

      10.1109/msp.2023.3276171

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Wavelength-proportional interpolation and extrapolation of virtual microphone for underdetermined speech enhancement2023

    • 著者名/発表者名
      R. Jinzai, K. Yamaoka, S. Makino, N. Ono, M. Matsumoto, and T. Yamada
    • 雑誌名

      APSIPA Trans. Signal and Information Processing

      巻: vol. 12 号: 3 ページ: 1-22

    • DOI

      10.1561/116.00000078

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Virtual microphone technique for binauralization for multiple sound images on 2-channel stereo signals detected by microphones mounted closely2023

    • 著者名/発表者名
      R. Jinzai, K. Yamaoka, S. Makino, N. Ono, T. Yamada, and M. Matsumoto
    • 雑誌名

      APSIPA Trans. Signal and Information Processing

      巻: vol. 12 号: 1 ページ: 1-21

    • DOI

      10.1561/116.00000079

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] Moving interference speaker removal using geometrically constrained independent vector analysis2023

    • 著者名/発表者名
      S. Furunaga, T. Ueda, and S. Makino
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 関連する報告書
      2023 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Spatially-regularized switching independent vector analysis2023

    • 著者名/発表者名
      T. Ueda, T. Nakatani, R. Ikeshita, S. Araki, and S. Makino
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] On joint dereverberation and source separation with geometrical constraints and iterative source steering2023

    • 著者名/発表者名
      K. Mo, X. Wang, Y. Yang, T. Ueda, S. Makino, and J. Chen
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Geometrically constrained blind moving source extraction based on constant separation vector and auxiliary function technique2023

    • 著者名/発表者名
      R. Zhang, T. Ueda, and S. Makino
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Enhancing spectrogram for audio classification using time-frequency enhancer2023

    • 著者名/発表者名
      H. Xing, S. Zhang, D. Takeuchi, D. Niizumi, N. Harada, and S. Makino
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Constant separating vector-based blind source extraction and dereverberation for a moving speaker2023

    • 著者名/発表者名
      T. Ueda and S. Makino
    • 学会等名
      EUSIPCO
    • 関連する報告書
      2023 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Masked modeling duo vision transformer with multi-layer feature fusion on respiratory sound classification2023

    • 著者名/発表者名
      B. Liu, S. Zhang, D. Takeuchi, D. Niizumi, N. Harada, and S. Makino
    • 学会等名
      Detection and Classification of Acoustic Scenes and Events (DCASE)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 拡散モデルに基づく音声強調の複数マイク化と評価2023

    • 著者名/発表者名
      木村凜乃, 中谷智広, 加茂直之, Marc Delcroix, 荒木章子, 牧野昭二
    • 学会等名
      日本音響学会 2024年春 季研究発表会講演論文集
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Geometrically constrained moving interference suppression with estimated moving range2023

    • 著者名/発表者名
      M. Song, T. Ueda, and S. Makino
    • 学会等名
      日本音響学会 2023年秋季研究発表会講演論文集
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Phase derivative aware speech enhancement2023

    • 著者名/発表者名
      S. Zhang, D. Takeuchi, D. Niizumi, N. Harada, and S. Makino
    • 学会等名
      日本音響学会 2023年秋季研究発表会講演論文集
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Gated multi mini-patch extractor for pooling in audio classification2023

    • 著者名/発表者名
      B. He, S. Zhang, Z. Qiu, D. Takeuchi, D. Niizumi, N. Harada, and S. Makino
    • 学会等名
      日本音響学会 2023年秋季研究発表会講演論文集
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Time-frequency feature extractor applied for audio classification2023

    • 著者名/発表者名
      H. Xing, S. Zhang, D. Takeuchi, D. Niizumi, N. Harada, and S. Makino
    • 学会等名
      日本音響学会 2023年秋季研究発表会講演論文集
    • 関連する報告書
      2023 実績報告書

URL: 

公開日: 2023-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi