• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

深層ベイズ学習に基づく雑踏環境下でも頑健に動作する音源分離の教師なし学習

研究課題

研究課題/領域番号 19K21553
配分区分基金
研究機関国立研究開発法人産業技術総合研究所

研究代表者

坂東 宜昭  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (40828167)

研究期間 (年度) 2019-04-01 – 2020-03-31
キーワード音環境認識 / 音源分離 / 深層ベイズ学習 / 償却変分推論
研究実績の概要

令和元年度は,昨年度開発した深層ベイズ学習に基づく音源分離法の多チャネル分離への応用および,視聴覚統合技術への拡張を行った.
昨年度開発した枠組みで教師なし学習された音源分離器は,入力が単チャネルであるため,多チャネル法では性能劣化する空間的特徴が似た音源も分離できる.本特性を利用し,効果的に多チャネル音源分離を初期化できることを確認した.本内容は,査読付き国際会議 IEEE MLSP 2019 で発表した.
本年度はさらに,「画像内の音を発しうる物体の検出器を教師なし学習」する視聴覚統合の枠組みへの拡張を行った.本枠組みでは,音源分離に用いる時間周波数マスクを周辺化し,画像から音源位置候補を推論する音源定位DNNを教師なし(自己教師あり)学習する.本モデルでは,音源の空間相関行列を,事前に準備した基底空間相関行列の足し合わせで表現するため,拡散性音源(雑音)も表現できる.シミュレーションにて生成した,複数人物が投影された全方位画像と音声の混合音を用いた評価実験にて,提案法はマイク数が少ない状況でも頑健に音源定位できることを確認した.さらに,画像DNN(音源定位DNN)から推定された候補が,実際に音を発しているか検証するDNNを同時学習することで,音源数が未知の環境でも頑健に動作することを確認した.多くの来館者が訪れる科学館で実際に収録した全方位動画と多チャネル録音信号を用いた実データによる実験も実施し,査読付き国際会議に投稿した.
このように,深層ベイズ学習に基づく教師なし音環境認識システムを構築する基礎を確立できた.
またこれらの研究成果を評価され,日本音響学会2020年春季研究発表会のスペシャルセッションにて招待講演(ただし新型コロナウイルスのため予稿発表)した.

  • 研究成果

    (6件)

すべて 2020 2019 その他

すべて 学会発表 (5件) (うち国際学会 1件、 招待講演 2件) 備考 (1件)

  • [学会発表] 全方位画像と多チャネル音響信号を用いた自己教師あり深層音源定位2020

    • 著者名/発表者名
      升山 義紀, 坂東 宜昭, 大西 正輝, 矢田部 浩平, 及川 靖広
    • 学会等名
      日本音響学会2020年春季研究発表会
  • [学会発表] (招待講演)視聴覚情報の深層ベイズ学習に基づく音響シーン分析2020

    • 著者名/発表者名
      坂東 宜昭
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 招待講演
  • [学会発表] Deep Bayesian Unsupervised Source Separation Based on a Complex Gaussian Mixture Model2019

    • 著者名/発表者名
      Yoshiaki Bando, Yoko Sasaki, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Workshop on Machine Learning for Signal Processing
    • 国際学会
  • [学会発表] 混合複素ガウスモデルに基づく深層ベイズ音源分離2019

    • 著者名/発表者名
      坂東 宜昭, 佐々木 洋子, 吉井 和佳
    • 学会等名
      音学シンポジウム
  • [学会発表] 3次元・マルチモーダル音環境認識2019

    • 著者名/発表者名
      坂東 宜昭
    • 学会等名
      第25回 画像センシングシンポジウム
    • 招待講演
  • [備考] 研究代表者ホームページ

    • URL

      https://ybando.jp

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi