• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

位相差のモデルを活用したアドホックマイクロホンアレイ信号処理

研究課題

研究課題/領域番号 22KJ2545
補助金の研究課題番号 21J21371 (2021-2022)
研究種目

特別研究員奨励費

配分区分基金 (2023)
補助金 (2021-2022)
応募区分国内
審査区分 小区分61010:知覚情報処理関連
研究機関東京都立大学

研究代表者

升山 義紀  東京都立大学, 大学院システムデザイン研究科, 特別研究員(DC1)

研究期間 (年度) 2023-03-08 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
3,100千円 (直接経費: 3,100千円)
2023年度: 1,000千円 (直接経費: 1,000千円)
2022年度: 1,000千円 (直接経費: 1,000千円)
2021年度: 1,100千円 (直接経費: 1,100千円)
キーワード音響信号処理 / ビームフォーミング / 分散デバイス / 低遅延 / 遠隔音声認識 / アレイ信号処理 / 最適化
研究開始時の研究の概要

本研究の目的は、スマートフォンやタブレットPCなどの録音機能を有した機器を連携させること(アドホックアレイ信号処理)で、広範囲の音情報を取得し高精度なコミュニケーション分析・音環境理解を実現することである。アドホックアレイでは各マイクが同期されていないことで、通常のアレイ信号処理技術がそのままでは適用できない。そこで本研究では、収録された音響信号のみから同期を行う技術を確立し、更に深層ニューラルネットワークを用いて広範囲の音情報に基づいた音源分離・認識を統合的に行う。

研究実績の概要

本研究課題ではマイクロホンアレイを用いた多チャネル音響信号処理の実応用を見据え,分散配置されたデバイスを連携させ信号処理を行うアドホックアレイ信号処理,アレイ信号処理の低遅延化,さらにアレイ信号処理と音声認識の統合に取り組んできた.
アドホックアレイ信号処理では,スマートフォンやタブレットPCといった電子機器ごとのサンプリング周波数のずれにより,通常のアレイでは定常になるマイク間の位相差が非定常になり,従来のアレイ信号処理技術がそのままでは適用できなくなるという課題がある.本年度は昨年度に引き続きサンプリング周波数のずれの推定・補償に取り組み,提案手法のマイク数・音源数・残響時間などに対する頑健性を調査し条件によらず提案手法が有効であることを確認した.また,会議における議事録作成やスマートスピーカのインターフェースへの応用を見据えて,アレイ信号処理と音声認識の統合にも取り組んだ.本年度はビームフォーミングだけではなくTF-GridNetという最先端の多チャネル音声強調・分離技術も検討し,雑音・残響を含む複数人の会話の認識において単語誤り率を既存技術の1/8以下まで削減した.
一連の研究を通じて,アドホックアレイの高精度な同期やビームフォーミングの低遅延化を実現し,アレイ信号処理技術の適用範囲を拡張した.これらの課題を複数表現間の一貫性を考慮した最適化問題として定式化し,その効率的な解法を導出した.またCarnegie Mellon Universityとの共同研究では,深層学習に基づく多チャネル音声強調・分離技術を聴覚拡張や音声認識といった応用に合わせて最適化し,目的に応じて最適な音声強調・分離を実現した.

報告書

(3件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (14件)

すべて 2024 2023 2022 2021 その他

すべて 国際共同研究 (1件) 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 2件) 学会発表 (10件) (うち国際学会 6件)

  • [国際共同研究] Carnegie Mellon University(米国)

    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] Efficient Joint Optimization of Sampling Rate Offsets Using Entire Multichannel Signal2024

    • 著者名/発表者名
      Y. Masuyama, K. Yamaoka, T. Kawamura, and N. Ono
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 32 ページ: 1816-1828

    • DOI

      10.1109/taslp.2024.3369532

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Causal and Relaxed-Distortionless Response Beamforming for Online Target Source Extraction2024

    • 著者名/発表者名
      Y. Masuyama, K. Yamaoka, Y. Kinoshita, T. Nakashima, and N. Ono
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 32 ページ: 310-324

    • DOI

      10.1109/taslp.2023.3329377

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Online Phase Reconstruction via DNN-Based Phase Differences Estimation2023

    • 著者名/発表者名
      Y. Masuyama, K. Yatabe, K. Nagatomo and Y. Oikawa
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 31 ページ: 163-176

    • DOI

      10.1109/taslp.2022.3221041

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [学会発表] Exploring the Integration of Speech Separation and Recognition with Self-Supervised Learning Representation2023

    • 著者名/発表者名
      Y. Masuyama, X. Chang, W. Zhang, S. Cornell, Z.-Q. Wang, N. Ono, Y. Qian, and S. Watanabe
    • 学会等名
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Signal Reconstruction from Mel-Spectrogram Based on Bi-Level Consistency of Full-Band Magnitude and Phase2023

    • 著者名/発表者名
      Y. Masuyama, N. Ueno, and N. Ono
    • 学会等名
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] End-to-End Integration of Speech Recognition, Dereverberation, Beamforming, and Self-Supervised Learning Representation2023

    • 著者名/発表者名
      Y. Masuyama, X. Chang, S. Cornell, S. Watanabe and N. Ono
    • 学会等名
      IEEE Spoken Language Technology Workshop (SLT)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Multi-channel Target Speaker Extraction with Refinement: The Wavlab Submission to The Second Clarity Enhancement Challenge2022

    • 著者名/発表者名
      S. Cornell, Z. Q. Wang, Y. Masuyama, S. Watanabe, M. Pariente, N. Ono
    • 学会等名
      Clarity Challenge
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Joint Optimization of Sampling Rate Offsets Based on Entire Signal Relationship Among Distributed Microphones2022

    • 著者名/発表者名
      Y. Masuyama, K. Yamaoka, N. Ono
    • 学会等名
      Interspeech
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 因果的MPDRビームフォーマのオンライン化およびタップ長の影響評価2022

    • 著者名/発表者名
      升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴
    • 学会等名
      日本音響学会2022年秋季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 尤度計算に用いる周波数帯域の逐次増大による初期値に頑健なブラインド同期2022

    • 著者名/発表者名
      升山義紀, 山岡洸瑛, 小野順貴
    • 学会等名
      電子情報通信学会信号処理研究会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 補助関数法による複数の非同期録音信号のブラインド同期2022

    • 著者名/発表者名
      升山義紀, 山岡洸瑛, 小野順貴
    • 学会等名
      日本音響学会春季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Causal distortionless response beamforming by alternating direction method of multipliers2021

    • 著者名/発表者名
      Y. Masuyama, K. Yamaoka, Y. Kinoshita, N. Ono
    • 学会等名
      Proc. Asia-Pacific Signal Inf. Process. Assoc. Annual Summit Conf. (APSIPA ASC)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] 因果的MPDRビームフォーマの近接分離最適化による設計2021

    • 著者名/発表者名
      升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴
    • 学会等名
      日本音響学会秋季研究発表会講演論文集
    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2021-05-27   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi