• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Data-driven sound field measurement for high-resolution spatial audio analysis and its applications

Research Project

Project/Area Number 23K24864
Project/Area Number (Other) 22H03608 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 61010:Perceptual information processing-related
Research InstitutionNational Institute of Informatics (2023-2024)
The University of Tokyo (2022)

Principal Investigator

小山 翔一  国立情報学研究所, コンテンツ科学研究系, 准教授 (80734459)

Co-Investigator(Kenkyū-buntansha) 植野 夏樹  熊本大学, 大学院先端科学研究部(工), 准教授 (00939788)
中村 友彦  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50866308)
Project Period (FY) 2024-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2025: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2024: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Keywords音場解析 / 音響信号処理 / 機械学習 / バーチャルリアリティ
Outline of Research at the Start

本研究は,少数のセンサによる簡易かつ柔軟なシステムを用いて,高精度な音空間の解析を実現する,データ駆動型音場計測技術基盤の確立と その応用を目的とする。複数のセンサを用いた音空間(音場)の計測は,バーチャルリアリティ音響や音空間の可視化など,音場の推定 ・補間に基づく様々な工学的応用の基盤となる技術である。ここでは,事前に与えられる学習データ,あるいは逐次的な観測データに対し,波動場としての制約を保持しつつモデルを適応することによる,新たな音場計測技術を創出することを目指す。応用技術としては,特に音環境モニタリングや空間音響再現への適用について検討し,システムとしての実現を目標とする。

Outline of Annual Research Achievements

本年度は,1) 波動場の性質を組み入れた深層学習型音場計測法の発展形と評価,2) 音源/センサ位置非依存潜在変数による頭部伝達関数の個人化と振幅分布補間,の二つについて実施した。
1) 波動場の性質を組み入れた深層学習型音場計測法では,斉次ヘルムホルツ方程式を満たす制約を課したカーネル関数を,指向性成分と残響音成分に分離した音場のモデルに基づいて適応する手法について,昨年度に引き続き検討を行った。音場の指向生成分はvon Mises-Fisher型重み関数の線形和で,残響成分はニューラルネットワークで表現し,これらのパラメータを観測信号に基づいて最適化する。実環境データを含む様々な環境で評価を行った他,Physics-Informed Neural Networksなどの最新の技術との比較評価を行い,提案手法の優位性を示した。また,センサ側の補間だけでなく,音源側の補間にも対応する,領域間での音響伝達関数補間の問題に対しても適用を行った。ここではベイズ法を導入することで,雑音への頑健性を高める試みも行った。
2) 音源/センサ位置非依存潜在変数による頭部伝達関数の個人化と振幅分布補間では,頭部伝達関数(HRTF)を補間/アップサンプリングするための手法として,音源位置に非依存な潜在変数によるオートエンコーダを用いる手法の拡張を行った。まず,HRTFの個人化のための手法として,耳介形状のパラメータを入力としてHRTFを予測する問題において,直接HRTFを予測するのではなく,音源位置に非依存な潜在変数を予測する問題に置き換えることで効率的な予測を可能とする手法について検討を行った。また,音響伝達関数の振幅分布を補間する問題において,同様のアプローチを適用する手法についても検討を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度は,1) 波動場の性質を組み入れた深層学習型音場計測法の発展形と評価,2) 音源/センサ位置非依存潜在変数による頭部伝達関数の個人化と振幅分布補間,の二つについて,発展的な研究を実施できたと考えている。1)の内容は国際論文誌2編に採録されているほか,関連する内容が国際会議2件に採録されている。また,物理的特性に基づく機械学習による音場推定に関するチュートリアル論文も執筆し,国際論文誌に採録されてたほか,音場推定の基礎理論を中心とした内容の書籍を執筆した。2)の内容については国際会議に2件の投稿を行い,現在1件が採録決定,1件が査読中である。

Strategy for Future Research Activity

1) 波動場の性質を組み入れた深層学習型音場計測法については,現在波動場の性質を組み入れることが難しいと考えられている状況においての適用可能性について検討を実施する。具体的には,音場の振幅分布を補間する際には,波動方程式やヘルムホルツ方程式に関する制約を評価することが難しいが,位相復元と組み合わせることによってこれを実現することを検討する。2) 音源/センサ位置非依存潜在変数による頭部伝達関数の個人化と振幅分布補間については,HRTFの補間に関してはより簡易なデバイスで取得可能なデータ(例えば画像データ)を用いて個人化を行う手法について検討する。音響伝達関数補間への応用については,部屋の形状パラメータなどを組み入れることによる多様な環境への適用について検討を実施する。

Report

(3 results)
  • 2024 Research-status Report
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (23 results)

All 2025 2024 2023 2022 Other

All Int'l Joint Research (2 results) Journal Article (6 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 6 results,  Open Access: 3 results) Presentation (12 results) (of which Int'l Joint Research: 7 results) Book (1 results) Remarks (2 results)

  • [Int'l Joint Research] Lund University(スウェーデン)

    • Related Report
      2024 Research-status Report
  • [Int'l Joint Research] Polytechnic University of Milan(イタリア)

    • Related Report
      2024 Research-status Report
  • [Journal Article] Physics-Informed Machine Learning for Sound Field Estimation: Fundamentals, state of the art, and challenges2024

    • Author(s)
      Koyama Shoichi、Ribeiro Juliano G. C.、Nakamura Tomohiko、Ueno Natsuki、Pezzoli Mirco
    • Journal Title

      IEEE Signal Processing Magazine

      Volume: 41 Issue: 6 Pages: 60-71

    • DOI

      10.1109/msp.2024.3465896

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Sound Field Estimation Based on Physics-Constrained Kernel Interpolation Adapted to Environment2024

    • Author(s)
      Ribeiro Juliano G. C.、Koyama Shoichi、Horiuchi Ryosuke、Saruwatari Hiroshi
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 32 Pages: 4369-4383

    • DOI

      10.1109/taslp.2024.3467951

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Physics-constrained adaptive kernel interpolation for region-to-region acoustic transfer function: a Bayesian approach2024

    • Author(s)
      Ribeiro Juliano G. C.、Koyama Shoichi、Saruwatari Hiroshi
    • Journal Title

      EURASIP Journal on Audio, Speech, and Music Processing

      Volume: 2024 Issue: 1 Pages: 1-16

    • DOI

      10.1186/s13636-024-00362-6

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Sound Field Estimation Using Deep Kernel Learning Regularized by the Wave Equation2024

    • Author(s)
      Sundstroem David、Koyama Shoichi、Jakobsson Andreas
    • Journal Title

      Proceedings of International Workshop on Acoustic Signal Enhancement (IWAENC)

      Volume: - Pages: 319-323

    • DOI

      10.1109/iwaenc61483.2024.10694575

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Localizing Acoustic Energy in Sound Field Synthesis by Directionally Weighted Exterior Radiation Suppression2024

    • Author(s)
      Tomita Yoshihide、Koyama Shoichi、Saruwatari Hiroshi
    • Journal Title

      Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)

      Volume: - Pages: 321-325

    • DOI

      10.1109/icassp48485.2024.10448224

    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Weighted Pressure and Mode Matching for Sound Field Reproduction: Theoretical and Experimental Comparisons2023

    • Author(s)
      Koyama Shoichi、Kimura Keisuke、Ueno Natsuki
    • Journal Title

      Journal of the Audio Engineering Society

      Volume: 71 Issue: 4 Pages: 173-185

    • DOI

      10.17743/jaes.2022.0058

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] マイクロフォンの位置のずれに頑健な音場推定手法2025

    • Author(s)
      古閑 匠, 植野 夏樹
    • Organizer
      電子情報通信学会技術報告, vol.124, no.389, pp.7-12
    • Related Report
      2024 Research-status Report
  • [Presentation] Spatial active noise control method based on sound field interpolation from reference microphone signals2023

    • Author(s)
      Kazuyuki Arikawa, Shoichi Koyama, and Hiroshi Saruwatari
    • Organizer
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Kernel interpolation of acoustic transfer functions with adaptive kernel for directed and residual reverberations2023

    • Author(s)
      Juliano G. C. Ribeiro, Shoichi Koyama, and Hiroshi Saruwatari
    • Organizer
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Multichannel Active Noise Control with Exterior Radiation Suppression Based on Riemannian Optimization2023

    • Author(s)
      Takaaki Kojima, Kazuyuki Arikawa, Shoichi Koyama, and Hiroshi Saruwatari
    • Organizer
      European Signal Processing Conference (EUSIPCO)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Perceptual Quality Enhancement of Sound Field Synthesis Based on Combination of Pressure and Amplitude Matching2023

    • Author(s)
      Keisuke Kimura, Shoichi Koyama, and Hiroshi Saruwatari
    • Organizer
      Proceedings of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Kernel Interpolation of Incident Sound Field in Region Including Scattering Objects2023

    • Author(s)
      Shoichi Koyama, Masaki Nakada, Juliano G. C. Ribeiro, and Hiroshi Saruwatari
    • Organizer
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Physics-informed convolutional neural network with bicubic spline interpolation for sound field estimation2022

    • Author(s)
      Kazuhide Shigemi, Shoichi Koyama, Tomohiko Nakamura, and Hiroshi Saruwatari
    • Organizer
      International Workshop on Acoustic Signal Enhancement (IWAENC)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Head-Related Transfer Function Interpolation from Spatially Sparse Measurements Using Autoencoder with Source Position Conditioning2022

    • Author(s)
      Yuki Ito, Tomohiko Nakamura, Shoichi Koyama, and Hiroshi Saruwatari
    • Organizer
      nternational Workshop on Acoustic Signal Enhancement (IWAENC)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 差分近似型Helmholtz方程式に基づく損失関数を用いた深層学習による少数観測点からの音場推定2022

    • Author(s)
      重見 和秀, 小山 翔一, 中村 友彦, 猿渡 洋
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 球波動関数展開を用いた深層学習による少数測定データからの頭部伝達関数補間2022

    • Author(s)
      伊藤 悠貴, 中村 友彦, 小山 翔一, 猿渡 洋
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] スプライン補間に基づく音場表現を用いたPhysics-Informed Neural Networksによる音場推定 -散乱体を含む領域に関する検証-2022

    • Author(s)
      重見 和秀, 小山 翔一, 中村 友彦, 猿渡 洋
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Related Report
      2022 Annual Research Report
  • [Presentation] 音源位置で条件付けた自己符号化器を用いた少数測定データからの頭部伝達関数補間2022

    • Author(s)
      伊藤 悠貴, 中村 友彦, 小山 翔一, 猿渡 洋
    • Organizer
      日本音響学会秋季研究発表会講演論文集
    • Related Report
      2022 Annual Research Report
  • [Book] Sound Field Estimation: Theories and Applications2025

    • Author(s)
      Natsuki Ueno and Shoichi Koyama
    • Total Pages
      114
    • Publisher
      Now Publishers
    • ISBN
      1638285241
    • Related Report
      2024 Research-status Report
  • [Remarks] NII S.Koyama's Lab Publications

    • URL

      https://www.ap.nii.ac.jp/ja/publications/

    • Related Report
      2024 Research-status Report
  • [Remarks] NII S. Koytama's Lab Publications

    • URL

      https://www.ap.nii.ac.jp/ja/publications/

    • Related Report
      2023 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi