• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Innovation of speech / acoustic scene recognition based on distributed acoustic sensing and asynchronous sequence modeling

Research Project

Project/Area Number 20H00613
Research InstitutionTokyo Metropolitan University

Principal Investigator

小野 順貴  東京都立大学, システムデザイン研究科, 教授 (80334259)

Co-Investigator(Kenkyū-buntansha) 須山 章子 (荒木章子)  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (30396212)
井本 桂右  同志社大学, 理工学部, 准教授 (90802116)
宮崎 亮一  徳山工業高等専門学校, 情報電子工学科, 准教授 (40734728)
貴家 仁志  東京都立大学, システムデザイン研究科, 教授 (40157110)
塩田 さやか  東京都立大学, システムデザイン研究科, 助教 (90705039)
Project Period (FY) 2020-04-01 – 2024-03-31
Keywords分散マイクロホンアレイ / 音声認識 / 音響シーン認識 / 同期 / 音源分離 / ブリンキー
Outline of Annual Research Achievements

2021年度は以下の成果を得た。
1) 音響シーン認識:分散マイクロホンによる観測の一部に欠損がある場合,欠損を模擬したモデル学習やAutoEncoderによる欠損の補完により,シーン分類性能低下を防ぐ手法を提案した。また,音響イベント検出と音響シーン認識を同時にモデル化し,音響イベントの弱ラベルを用いて相互に性能を高めあう学習法を提案した。ブリンキーを用いることを想定した end-to-end学習に基づく音響シーン認識についても検討を進めた。2) ブリンキーに基づく分散音響センシング:小規模DNNをブリンキー内で動作させることに成功した。また,光信号飽和時に伝達係数と信号を推定する手法を提案した。新たな展開として,音響信号から複数ブリンキーの光信号への変換を圧縮センシングと捉え,スパースなスペクトルを復元する手法を提案した。3) 非同期信号の同期技術:補助関数法を用いた複数時間差推定のオンライン化について検討した。また,この手法をサンプリング周波数ミスマッチの同時推定に拡張した。4) 微弱周期信号への動的同期加算:サンプリング周波数が微小に時間変動する環境下で微弱周期信号を強調する手法を,インパルス応答推定に応用した。さらに前年度収録したデータベースを用いて実環境での評価も行った。5) アレイ信号処理の発展:リアルタイム応用を想定し,因果性制約下近接分離最適化によりビームフォーマーを設計する手法を提案した。時間周波数線形結合ビームフォーマーについても最適なフィルタ数について検討を進めた。音場補間に基づく,マイクロホンアレイの回転に頑健なビームフォーミングを提案した。6) 実世界応用:自閉スペクトラム症診断のための対話音声の分散録音と分析について検討を進めた他,国立国語研究所が公開している日常会話コーパスに対して,ブラインド同期と音源分離による重畳音声の分離を試みた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2021年度も引き続き,コロナ禍の影響を強く受けつつ研究を進めることになったが,補助関数法を用いた複数時間差推定のサンプリング周波数ミスマッチの同時推定への拡張,音場補間ビームフォーマ,動的同期加算を用いた微弱周期信号の強調に基づくインパルス応答推定など,前年度の成果に基づく進展がみられたほか,分散マイクロホンアレイにおける欠損を補う手法の提案,シーン認識とイベント検出の同時モデリング,因果性ビームフォーマ,圧縮センシングによるスパーススペクトル復元など,新たな研究成果も複数得られた。また,国立国語研究所が作成した日常会話コーパスという,実環境での非同期分散収録データに対する重畳音声の分離も始めている。関連して,国立国語研究所 言語資源活用ワークショップで研究代表者の小野がオンライン招待講演を行った。また,国際会議APSIPA ASC2021において,Sadaoki Furui Prize Paper Award受賞,APSIPA Best Paper Award受賞,指導学生が日本音響学会学生優秀発表賞(2件)など,多くの受賞も得られ,おおむね順調に進展していると評価する。

Strategy for Future Research Activity

今年度の成果を受けて,今後以下のように研究を進める方針である。
1) 音響シーン認識については引き続き,分散マイクロホンアレイを用いた空間特徴量の効果的な活用,音響シーン認識とイベント検出の同時モデリング,欠損を補間する手法の進展などを目指す。2) ブリンキーに基づく分散音響センシングについては,伝達係数と信号の統一的な推定方法を実環境で評価するほか,新たな展開としてスマホをブリンキーとして用いることについて検討を進める。3) 非同期信号の同期技術は,サンプリング周波数ミスマッチが時間変動したり,信号に欠損がある場合についての検討を始める。4) アレイ信号処理の発展としては,因果的なビームフォーマーの設計の効率化,複数の時間差やサンプリング周波数ミスマッチ推定における効果的な初期値の決定法,音場補間のブラインド音源分離への適用などへ展開していく。実世界応用については,自閉スペクトラム症診断支援,日常会話コーパスの重畳音声分離を引き続き進展させるとともに,交通量モニタリングについても検討を再開する予定である。

  • Research Products

    (24 results)

All 2022 2021

All Journal Article (10 results) (of which Peer Reviewed: 10 results,  Open Access: 2 results) Presentation (14 results) (of which Invited: 1 results)

  • [Journal Article] Time-Frequency-Bin-Wise Linear Combination of Beamformers for Distortionless Signal Enhancement2021

    • Author(s)
      Kouei Yamaoka, Nobutaka Ono, and Shoji Makino
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 29 Pages: 3461-3475

    • DOI

      10.1109/TASLP.2021.3126950

    • Peer Reviewed / Open Access
  • [Journal Article] Real-Time Pitch Visualization with Sound-to-Light Conversion Device Blinky2021

    • Author(s)
      Kanato Ishii, Yuma Kinoshita, Yukoh Wakabayashi, and Nobutaka Ono
    • Journal Title

      Journal of Signal Processing

      Volume: 25 Pages: 213-220

    • DOI

      10.2299/jsp.25.213

    • Peer Reviewed / Open Access
  • [Journal Article] Sharpening Directivity of Beamforming Based on Neural Networks Using Virtual Observations2021

    • Author(s)
      Yuki Kanekiyo, Mitsuhiro Mizumachi,?Ryoichi Miyazaki
    • Journal Title

      Proc. GCCE

      Volume: - Pages: 512-513

    • DOI

      10.1109/GCCE53005.2021.9621789

    • Peer Reviewed
  • [Journal Article] Phase representation based on HSV color model for acoustic classification with convolutional neural networks2021

    • Author(s)
      Yuki Shiroma, Yuma Kinoshita, Sayaka Shiota, and Hitoshi Kiya,
    • Journal Title

      Proc. GCCE

      Volume: - Pages: 427-429

    • DOI

      10.1109/GCCE53005.2021.9621891

    • Peer Reviewed
  • [Journal Article] Analysis on Roles of DNNs in End-to-End Acoustic Scene Analysis Framework with Distributed Sound-to-Light Conversion Devices2021

    • Author(s)
      Yuma Kinoshita and Nobutaka Ono
    • Journal Title

      Proc. APSIPA

      Volume: - Pages: 1167-1172

    • Peer Reviewed
  • [Journal Article] Causal Distortionless Response Beamforming by Alternating Direction Method of Multipliers2021

    • Author(s)
      Yoshiki Masuyama, Kouei Yamaoka, Yuma Kinoshita, and Nobutaka Ono
    • Journal Title

      Proc. APSIPA

      Volume: - Pages: 585-590

    • Peer Reviewed
  • [Journal Article] Investigation on Spatial and Frequency-based Features for Asynchronous Acoustic Scene Analysis2021

    • Author(s)
      Yuki Shiroma, Keisuke Imoto, Sayaka Shiota, Nobutaka Ono, and Hitoshi Kiya
    • Journal Title

      Proc. APSIPA

      Volume: - Pages: 1161-1166

    • Peer Reviewed
  • [Journal Article] Pitch and Volume Stability in the Communicative Response of the Adults with Autism2021

    • Author(s)
      Keiko Ochi, Masaki Kojima, Keiho Owada, Nobutaka Ono, Shigeki Sagayama, and Hidenori Yamasue
    • Journal Title

      Proc. APSIPA

      Volume: - Pages: 428-432

    • Peer Reviewed
  • [Journal Article] End-to-End Training for Acoustic Scene Analysis with Distributed Sound-to-Light Conversion Devices2021

    • Author(s)
      Yuma Kinoshita and Nobutaka Ono
    • Journal Title

      Proc. EUSIPCO

      Volume: - Pages: 1010-1014

    • DOI

      10.23919/EUSIPCO54536.2021.9616341

    • Peer Reviewed
  • [Journal Article] Rotation-robust beamforming based on sound field interpolation with regularly circular microphone array2021

    • Author(s)
      Yukoh Wakabayashi, Kouei Yamaoka, and Nobutaka Ono
    • Journal Title

      Proc. ICASSP

      Volume: - Pages: 771-775

    • DOI

      10.1109/ICASSP39728.2021.9414196

    • Peer Reviewed
  • [Presentation] 『日本語日常会話コーパス』における発話の重なり分析とそれに対する音源分離の検討2022

    • Author(s)
      南木 春希, 山岡 洸瑛, 若林 佑幸, 小野 順貴
    • Organizer
      シンポジウム「日常会話コーパス」Ⅶ
  • [Presentation] 自己符号化器を用いた多チャンネル信号の欠損復元法と環境音分類における評価2022

    • Author(s)
      城間 佑樹, 木下 裕磨, 井本 桂右, 塩田 さやか, 小野 順貴, 貴家 仁志
    • Organizer
      電気音響/応用音響研究会
  • [Presentation] 弱ラベルを用いた音響シーンとイベントの同時分析2022

    • Author(s)
      椿 竣介,宇都 瑛祐,井本 桂右,小野 順貴
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 音光変換デバイス「ブリンキー」を用いた振幅スペクトルの圧縮センシング2022

    • Author(s)
      本山 智司, 石井 奏人, 植野 夏樹, 木下 裕磨, 小野 順貴
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 補助関数法を用いた複数時間差のオンライン推定2022

    • Author(s)
      山岡 洸瑛, 中嶋 大志, 若林 佑幸, 小野 順貴
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 補助関数法による複数の非同期録音信号のブラインド同期2022

    • Author(s)
      升山 義紀, 山岡 洸瑛, 小野 順貴
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の推定2022

    • Author(s)
      西田 光佑, 石井 奏人, 植野 夏樹, 木下 裕磨, 小野 順貴
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 非同期分散マイクロフォンを活用する音響信号処理2021

    • Author(s)
      小野順貴
    • Organizer
      言語資源活用ワークショップ
    • Invited
  • [Presentation] 円状マイクロホンアレイを利用した音場補間によるステアリングベクトル補間への応用2021

    • Author(s)
      若林 佑幸, 山岡 洸瑛, 小野 順貴
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 時間周波数線形結合ビームフォーマの空間フィルタ数に対する音源強調性能の評価2021

    • Author(s)
      山岡 洸瑛, 小野 順貴
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 因果的MPDRビームフォーマの近接分離最適化による設計2021

    • Author(s)
      升山 義紀, 山岡 洸瑛, 木下 裕磨, 小野 順貴
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 微弱周期信号と動的同期加算を用いたサンプリング周波数変動下でのインパルス応答推定2021

    • Author(s)
      住吉 亨介, 山岡 洸瑛, 若林 佑幸, 小野 順貴
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 深層学習に基づく楽器音分類のための画像分類ネットワークを用いたファインチューニング2021

    • Author(s)
      城間 佑樹, 木下 裕磨, 塩田 さやか, 貴家 仁志
    • Organizer
      音学シンポジウム
  • [Presentation] 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討2021

    • Author(s)
      南木 春希, 山岡 洸瑛, 若林 佑幸, 小野 順貴
    • Organizer
      音学シンポジウム

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi