• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

非同期分散マイクアレイにおけるキャリブレーションフリーモデルの研究

研究課題

研究課題/領域番号 19K12017
研究機関東京工業大学

研究代表者

糸山 克寿  東京工業大学, 工学院, 特任講師 (60614451)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード音響信号処理 / マイクロホンアレイ / キャリブレーション / 音源定位 / 音源分離
研究実績の概要

本研究課題では,キャリブレーション(マイクロホンやマイクロホンアレイのサンプリング周波数や位置のずれを精密な測定により事前に補正すること)を行わずに非同期分散マイクアレイ(複数のマイクロホンを同期させて用いるデバイスであるマイクロホンアレイに対して,独立した複数のマイクロホンをあたかもマイクロホンアレイであるかのように扱う)に対して音源定位や音源分離などのアレイ信号処理を実現することを目指す.具体的に,令和元年度は以下について取り組んだ.
・非同期複数マイクロホンにより録音された複数音源の混合音を用いて,各マイクロホンのサンプリング周波数のずれとサンプル時刻のずれを推定し,さらにその結果に基づいて音源の位置を推定する(音源定位)手法と各音源信号を推定する(音源分離)手法について研究した.
・形状が未知のマイクロホンアレイにより録音された複数音源の混合音を用いて,各マイクロホンの位置を推定し,さらにその結果に基づいて音源の位置を推定する手法について研究した.
・十分に同期がとられていない複数のマイクロホンアレイを用いて,複数の音源の中から任意に選択された一つの音源の信号のみを抽出する,スポットフォーミング法について研究した.
これらの研究は,「センサアレイを構築するために必要な時間的同期やキャリブレーションと等価な前提条件は何か?」という学術的「問い」の解明に向けた第一のステップとしての意義を持つ.これらの手法に基づいて,様々な前提条件がセンサアレイ構築に対して寄与する度合いを調査することで,アレイ信号処理の適用範囲が広がることが期待される.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

令和元年度の取り組みとして当初計画していた,複数音源を対象とした同期・マイク位置推定・音源定位・音源分離の統合的モデル構築を行ったため,概ね順調に進展していると判断する.

今後の研究の推進方策

当初の計画通り,前年度までに構築した手法のオンライン化,およびキャリブレーションと等価な前提条件の定量的評価に取り組む.

次年度使用額が生じた理由

COVID-19により予定されていた出張が取りやめになったため,次年度への繰越が生じた.繰越金はジャーナル論文への投稿やそのための英文添削等に重点的に使用する計画である.

  • 研究成果

    (29件)

すべて 2020 2019

すべて 雑誌論文 (1件) 学会発表 (27件) (うち国際学会 9件) 産業財産権 (1件)

  • [雑誌論文] Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition2019

    • 著者名/発表者名
      Shimada Kazuki、Bando Yoshiaki、Mimura Masato、Itoyama Katsutoshi、Yoshii Kazuyoshi、Kawahara Tatsuya
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 27 ページ: 960~971

    • DOI

      10.1109/TASLP.2019.2907015

  • [学会発表] Sound Source Tracking by Drones with Microphone Arrays2020

    • 著者名/発表者名
      Taiki YAMADA, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2020 IEEE/SICE International Symposium on System Integration (SII2020)
    • 国際学会
  • [学会発表] Audio-Visual 3D Reconstruction Framework for Dynamic Scenes2020

    • 著者名/発表者名
      Takeshi KONNO, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2020 IEEE/SICE International Symposium on System Integration (SII2020)
    • 国際学会
  • [学会発表] Design and Assessment of a Scan-And-Sum Beamformer for Surface Sound Source Separation2020

    • 著者名/発表者名
      Zhi ZHONG, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2020 IEEE/SICE International Symposium on System Integration (SII2020)
    • 国際学会
  • [学会発表] Multi-Channel Environmental Sound Segmentation2020

    • 著者名/発表者名
      Yui SUDO, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2020 IEEE/SICE International Symposium on System Integration (SII2020)
    • 国際学会
  • [学会発表] Calibration of a Microphone Array Based on a Probabilistic Model of Microphone Positions2020

    • 著者名/発表者名
      Katsuhiro DAN, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      33rd International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA/AIE 2020)
    • 国際学会
  • [学会発表] Spatial Filter Design for Surface Sound Source Separation2020

    • 著者名/発表者名
      鍾 知, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      情報処理学会第82回全国大会
  • [学会発表] 複数マイクロホンアレイを用いた尤度分布統合による移動音源追跡2020

    • 著者名/発表者名
      山田 泰基, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      情報処理学会第82回全国大会
  • [学会発表] クラウドソーシングを用いた作成した環境音キャプションコーパスの評価2020

    • 著者名/発表者名
      岩月 道生, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      情報処理学会第82回全国大会
  • [学会発表] バイナリマスク付き非負値行列因子分解に基づく音源分離手法の発音時刻ずれに対する性能評価2020

    • 著者名/発表者名
      日下 湧太, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      情報処理学会第82回全国大会
  • [学会発表] Listen and Tell: Acoustic Scene Caption Generation using Deep Learning2019

    • 著者名/発表者名
      Michio IWATSUKI, Yui SUDO, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      the Third International Workshop on Symbolic-Neural Learning (SNL 2019)
    • 国際学会
  • [学会発表] Sound Source Tracking Using Multiple Microphone Arrays Mounted to an Unmanned Aerial Vehicle2019

    • 著者名/発表者名
      Taiki YAMADA, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      ICRA 2019 Workshop on Sound Source Localization and Its Applications for Robots
    • 国際学会
  • [学会発表] Improvement of DOA Estimation by using Quaternion Output in Sound Event Localization and Detection2019

    • 著者名/発表者名
      Yui SUDO, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2019 DCASE Workshop
    • 国際学会
  • [学会発表] Environmental Sound Segmentation Utilizing Mask U-Net2019

    • 著者名/発表者名
      Yui SUDO, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2019)
    • 国際学会
  • [学会発表] 柔軟索状レスキューロボットのための空気噴射音下での単チャネル音声強調2019

    • 著者名/発表者名
      坂東 宜昭, 安部 祐一, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 奥乃 博
    • 学会等名
      ロボティクス・メカトロニクス 講演会 2019 (ROBOMECH2019)
  • [学会発表] バイナリマスク付き非負値行列因子分解による発音時刻を用いた音源分離手法とその評価2019

    • 著者名/発表者名
      日下 湧太, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      情報処理学会 第124回音楽情報科学研究会
  • [学会発表] Design of a Scan-and-sum Beamformer for Surface Sound Source Separation2019

    • 著者名/発表者名
      Zhi ZHONG, Katsutoshi ITOYAMA, Kenji NISHIDA, Kazuhiro NAKADAI
    • 学会等名
      第37回日本ロボット学会学術講演会 (RSJ 2019)
  • [学会発表] 複数マイクロホンアレイを搭載した複数のUAVによる移動音源の三次元追跡手法の実収録音評価2019

    • 著者名/発表者名
      山田 泰基, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第37回日本ロボット学会学術講演会 (RSJ 2019)
  • [学会発表] 音環境説明ロボットの実現に向けた環境音キャプションコーパスの構築2019

    • 著者名/発表者名
      岩月 道生, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第37回日本ロボット学会学術講演会 (RSJ 2019)
  • [学会発表] 複数同時音源を用いたマイクロホンアレイのキャリブレーション2019

    • 著者名/発表者名
      段 雄啓, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第37回日本ロボット学会学術講演会 (RSJ 2019)
  • [学会発表] バイナリマスク付き非負値行列因子分解による発音時刻を用いた音源分離手法の評価2019

    • 著者名/発表者名
      日下 湧太, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第37回日本ロボット学会学術講演会 (RSJ 2019)
  • [学会発表] 複数マイクロホンアレイにおける音源方向尤度に基づく三次元音源追跡2019

    • 著者名/発表者名
      山田 泰基, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第55回人工知能学会 AIチャレンジ研究会
  • [学会発表] スペクトル伸縮モデルと複素正規分布音源モデルに基づく複数マイクロホンの同期2019

    • 著者名/発表者名
      糸山 克寿, 中臺 一博
    • 学会等名
      第55回人工知能学会 AIチャレンジ研究会
  • [学会発表] 視聴覚統合による動的環境下における三次元再構成の提案2019

    • 著者名/発表者名
      紺野 隆志, 西田 健次, 糸山 克寿, 中臺 一博
    • 学会等名
      第55回人工知能学会 AIチャレンジ研究会
  • [学会発表] リハビリテーション効果推定のための感情識別器の構成と評価2019

    • 著者名/発表者名
      西田 健次, 山田 亨, 藤村 友美, 糸山 克寿, 中臺 一博
    • 学会等名
      第55回人工知能学会 AIチャレンジ研究会
  • [学会発表] 音響距離計測情報を用いた透明物体の三次元構造復元法の検討2019

    • 著者名/発表者名
      岡本 悠太朗, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第20回計測自動制御学会システムインテグレーション部門講演会 (SI2019)
  • [学会発表] 重み付け尤度関数と定在波を用いた可聴音による距離測定2019

    • 著者名/発表者名
      岸波 華彦, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第20回計測自動制御学会システムインテグレーション部門講演会 (SI2019)
  • [学会発表] 複数マイクロホンアレイを用いたLDAによるスポットフォーミングの検討2019

    • 著者名/発表者名
      鍵本 泰宏, 糸山 克寿, 西田 健次, 中臺 一博
    • 学会等名
      第20回計測自動制御学会システムインテグレーション部門講演会 (SI2019)
  • [産業財産権] 三次元構造復元装置、三次元構造復元方法、およびプログラム2019

    • 発明者名
      糸山 克寿, 西田 健二, 紺野 隆志, 中臺 一博
    • 権利者名
      東京工業大学
    • 産業財産権種類
      特許
    • 産業財産権番号
      特願2019-224768

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi