• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

A study on environmental sound analysis based on unified and continual learning

Research Project

Project/Area Number 23K16908
Research InstitutionDoshisha University

Principal Investigator

井本 桂右  同志社大学, 文化情報学部, 准教授 (90802116)

Project Period (FY) 2023-04-01 – 2026-03-31
Keywords環境音分析 / 音響シーン分類 / 音響イベント検出 / 継続学習 / コーパス
Outline of Annual Research Achievements

本研究課題の目的は,1つの機械学習モデルを複数の環境音分析タスクに適用可能な,統一的モデル学習手法の確立,ならびに,分析対象とする環境音の種類が変化/増加した場合においても,学習済みのモデルを継続して利用可能な継続的モデル学習手法の確立である.とりわけ,本研究課題では,(1)複数の環境音分析タスクに横断的に利用可能な大規模データセットの構築とオープンデータとしての公開,ならびに,(2)複数の環境音分析タスクをコンパクトな一つのモデルで分析できるモデル学習手法の開発と性能評価,また,(3)学習済みデータの永続的な保存を不要とする継続的モデル学習手法の開発と性能評価を実施する.
令和5年度は,(1)音響イベント検出と音響シーン分析に利用可能なタスク横断型の大規模データセットを構築した.構築したデータセットはGitHubやZenodoなどのオープンレポジトリにて公開する準備を進めている.また,複数言語の説明文が付与された環境音データセット構築を進め,音響キャプション生成の基本性能分析を実施した.さらに,(2)(3)音響シーン分類と音響イベント検出を同時に分析可能で,かつ,知識蒸留に基づく継続的モデル学習手法を開発し,従来の環境音分析手法を大幅に上回る性能を達成した.これらの研究成果は音響信号処理のトップ会議であるICASSP2024やAPSIPA ASC2023などに論文投稿して採択された他,4件の国内学会発表を行った.また,関連国内学会で受賞するなど大いに注目を集めた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

国際会議論文2編(うち1編は分野のトップ会議であるICASSP),国内学会発表4件という成果が得られた.また,2編の解説論文を執筆し,当該研究分野の認知度向上に大きく貢献した.研究成果の一部は令和6年度に計画していたものであり,概ね順調に進展していると言える.

Strategy for Future Research Activity

順調に研究が進展しており,当初の計画から大きな変更は必要ないと考えている.今後は,(2)複数の環境音分析タスクをコンパクトな一つのモデルで分析できるモデル学習法の開発と性能評価,(3)学習済みのデータの永続的な保存を不要とする継続的モデル学習法の検討を進める.とりわけ,3以上の環境音タスクを同時に分析可能な手法の開発や高精度化を進める.

Causes of Carryover

収録機器や手順の見直しにより,備品費が安く購入できた他,学会発表費/参加費が一部不要となったため,次年度使用額が生じた.研究計画が順調に進展しているため,生じた次年度使用額,および,今年度請求額は論文投稿費や英文添削費用,また計算機の追加購入により使用し,研究をさらに加速させることとする.

  • Research Products

    (8 results)

All 2024 2023

All Journal Article (2 results) (of which Open Access: 1 results) Presentation (6 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] DCASE Challenge: 環境音分析・理解のための統合的コンペティション2023

    • Author(s)
      井本 桂右
    • Journal Title

      日本音響学会誌

      Volume: 79 Pages: 470~476

    • DOI

      10.20697/jasj.79.9_470

    • Open Access
  • [Journal Article] 環境音分析2023

    • Author(s)
      井本 桂右
    • Journal Title

      電子情報通信学会誌

      Volume: 106 Pages: 774-776

  • [Presentation] アノテータごとのばらつきを考慮した音響イベント検出2024

    • Author(s)
      古賀 直樹, 坂東 宣昭, 井本 桂右
    • Organizer
      情報処理学会 第86回全国大会
  • [Presentation] 環境音に対する日本語自由記述文コーパスとベンチマーク分析2024

    • Author(s)
      岡本 悠希, 高道 慎之介, 森松 亜衣, 渡邊 亞椰, 井本 桂右, 山下 洋一
    • Organizer
      言語処理学会 第30回年次大会
  • [Presentation] 環境音分析における事前学習済みモデルのバイアス調査2024

    • Author(s)
      井上 かほり, 井本 桂右
    • Organizer
      日本音響学会 2024年春季研究発表会
  • [Presentation] Voice-to-foley: 環境音を模倣した音声を入力とする環境音合成2024

    • Author(s)
      岡本 悠希, 井本 桂右, 高道 慎之介, 永瀬 亮太郎, 福森 隆寛, 山下 洋一
    • Organizer
      日本音響学会 2024年春季研究発表会
  • [Presentation] Environmental Sound Synthesis From Vocal Imitations and Sound Event Labels2023

    • Author(s)
      Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryotaro Nagase, Takahiro Fukumori, and Yoichi Yamashita
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-Supervised Approach2023

    • Author(s)
      Ami Igarashi, Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Noboru Harada, and Keisuke Imoto
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi