2023 Fiscal Year Annual Research Report
Development of sound source separation method focusing on the singular point in spatio-temporal spectrum
Project/Area Number |
19K04408
|
Research Institution | University of Yamanashi |
Principal Investigator |
小澤 賢司 山梨大学, 大学院総合研究部, 教授 (30204192)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 貫治 秋田県立大学, システム科学技術学部, 准教授 (20452998)
坂本 修一 東北大学, 電気通信研究所, 教授 (60332524)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 時空間音圧分布画像 / マイクロホンアレイ / 特異点 / 音源分離 / 時空間スペクトル / ニューラルネットワーク / フェーズドアレイ / スパースベイズ信号処理 |
Outline of Annual Research Achievements |
本研究では,スマートフォンに搭載可能な程度の小規模マイクロホンアレイにより,高精度な目的音抽出の実現を目指して研究プロジェクトを開始した。そのための基本戦略として,アレイ出力を画像(時空間音圧分布画像)と見なした場合に,その時空間スペクトルにおいては音源位置が特異点となることを利用する。特に,方向が同一で距離のみが異なる複数音源からの抽出を可能とすることに意義があると考えている。 4個のマイクロホンを約6 cmの円弧上に配置したアレイを想定し,同一方向にある4個の音源の音源を分離することに2021年度までに成功した。2022年度には,同一方向にある目的音に仮想焦点をあわせ,それ以外の音を一括して消去することができることを示した。これらに共通して「音源までの距離」の情報が重要であるため,2022年度から音源測距問題に取り組み,2023年度には複素スパースベイズ推定を導入することで5 mまでの複数音源について測距可能性を示した。その成果を,国内では情報処理学会・電子情報通信学会の研究会で,また国際会議ICICT 2024で報告した。 別の解法として,振幅スペクトルを音圧レベルで表示した非線形連立方程式をニューラルネットワーク(NN)により解くことを検討した。この件に関しては,直線上に配置したアレイに平面波が到来するという最も基本的な場合を取り上げ検討を行った。2雑音到来条件で時空間音圧分布画像のスペクトルをNNで学習することで,3雑音についても雑音低減効果があることを2022年度までに示した。 さらに,2020年度には,4個のマイクロホンを平面上に配置することで,立体角2π[sr]の空間における音源分離に適用できることも示した。 以上を総じて,スマートフォンに搭載可能な程度の小規模マイクロホンアレイにより,高精度に目的音を抽出することに成功したと考えている。
|
Research Products
(4 results)