• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

空間アテンション機構に基づく新しい音響シーン識別手法の確立

研究課題

研究課題/領域番号 20K11880
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関筑波大学

研究代表者

山田 武志  筑波大学, システム情報系, 教授 (20312829)

研究期間 (年度) 2020-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード音響シーン識別 / 空間アテンション機構 / ビームフォーマ / 空間フィルタ / ニューラルネットワーク / 損失関数 / 空間信号処理 / 音響イベント検出 / マイクロホンアレー / 空間情報 / アテンション機構
研究開始時の研究の概要

音響シーン識別において複数のマイクの録音信号を入力することにより、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。

研究成果の概要

本研究では、ビームフォーマを前処理として用いる音響シーン識別手法の性能を改善するために、音響シーンに存在する複数の音の中から注目すべき音(識別に有用な音)に自動的に焦点を当てる空間アテンション機構という新しいアイデアを導入した。その実現のために、複数の空間フィルタ出力への自動重み付けに基づく識別手法、及びその拡張である空間フィルタの自動推定に基づく識別手法を提案し、実験によりその有効性を示した。

研究成果の学術的意義や社会的意義

本研究成果の学術的独自性と創造性は、空間アテンション機構という新しいアイデアを実現した点にある。これにより、目的音方向などの事前情報を必要とせず、注目すべき音がどの音なのかを自動的に見つけると共に、それを強調するための空間フィルタを自動推定することが可能となった。これは信号処理技術と識別技術の有機的な統合によって成し得たものであり、音響シーン識別のみならず、雑音下音声認識などの他の様々なタスクへの展開が期待できる。

報告書

(5件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (9件)

すべて 2024 2022 2021

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (8件) (うち国際学会 3件)

  • [雑誌論文] Monitoring of Domestic Activities Using Multiple Beamformers and Attention Mechanism2021

    • 著者名/発表者名
      Kaneko Yuki、Yamada Takeshi、Makino Shoji
    • 雑誌名

      信号処理

      巻: 25 号: 6 ページ: 239-243

    • DOI

      10.2299/jsp.25.239

    • NAID

      130008110097

    • ISSN
      1342-6230, 1880-1013
    • 年月日
      2021-11-01
    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] 注目すべき音を自動検出するニューラルビームフォーマの残響下での有効性評価2024

    • 著者名/発表者名
      市川創大, 山田武志
    • 学会等名
      日本音響学会春季研究発表会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Neural beamformer with automatic detection of notable sounds for acoustic scene classification2022

    • 著者名/発表者名
      Sota Ichikawa, Takeshi Yamada, Shoji Makino
    • 学会等名
      APSIPA ASC (Asia-Pacific Signal and Information Processing Association Annual Summit and Conference) 2022
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] 音響シーン識別のための注目すべき音を自動検出するニューラルビームフォーマの検討2022

    • 著者名/発表者名
      市川創大, 山田武志, 牧野昭二
    • 学会等名
      音学シンポジウム2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Semi-supervised learning using weakly labeled data generated by GAN in sound event detection2022

    • 著者名/発表者名
      Kazuya Ouma, Takeshi Yamada, Shoji Makino
    • 学会等名
      RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2022 (NCSP'22)
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] Wave-U-Netと識別器のエンドツーエンド学習による音響シーン識別の検討2022

    • 著者名/発表者名
      山田友紀, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 音響イベント検出におけるGANを用いた弱ラベルデータ生成による半教師あり学習2021

    • 著者名/発表者名
      合馬一弥, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Monitoring of domestic activities using multiple beamformers and attention mechanism2021

    • 著者名/発表者名
      Yuki Kaneko, Takeshi Yamada, Shoji Makino
    • 学会等名
      RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing 2021 (NCSP'21)
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] 音響イベント検出と位置推定における転移学習の効果の検証2021

    • 著者名/発表者名
      陳軼夫, 山田武志, 牧野昭二
    • 学会等名
      日本音響学会2021年春季研究発表会
    • 関連する報告書
      2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi