研究課題/領域番号 |
19K04408
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分21030:計測工学関連
|
研究機関 | 山梨大学 |
研究代表者 |
小澤 賢司 山梨大学, 大学院総合研究部, 教授 (30204192)
|
研究分担者 |
渡辺 貫治 秋田県立大学, システム科学技術学部, 准教授 (20452998)
坂本 修一 東北大学, 電気通信研究所, 教授 (60332524)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 時空間音圧分布画像 / マイクロホンアレイ / 特異点 / 音源分離 / 時空間スペクトル / ニューラルネットワーク / フェーズドアレイ / スパースベイズ信号処理 / ベイズ信号処理 / 雑音抑圧 / 2次元高速フーリエ変換 |
研究開始時の研究の概要 |
スマートスピーカ・ヒアラブルデバイスなど音声インタフェースが身近な存在となり,また米国・韓国ではテレビのオブジェクトベースオーディオ放送が開始されるなど,所望の音のみを抽出することが有益な場面が増えている。本研究では,眼鏡フレームに搭載可能な程度の小規模マイクロホンアレイにより,高精度な目的音抽出の実現を目指す。その基本戦略として,アレイ出力を画像と見なした場合に,その時空間スペクトルにおいては音源位置が特異点となることを利用する。特に,方向が同一で距離のみが異なる複数音源からの抽出を可能とすることに意義があり,これにより空間全体を音オブジェクトの集合として分解できることを示す。
|
研究実績の概要 |
本研究では,スマートフォンに搭載可能な程度の小規模マイクロホンアレイにより,高精度な目的音抽出の実現を目指して研究プロジェクトを開始した。そのための基本戦略として,アレイ出力を画像(時空間音圧分布画像)と見なした場合に,その時空間スペクトルにおいては音源位置が特異点となることを利用する。特に,方向が同一で距離のみが異なる複数音源からの抽出を可能とすることに意義があると考えている。 4個のマイクロホンを約6 cmの円弧上に配置したアレイを想定し,同一方向にある4個の音源の音源を分離することに2021年度までに成功した。2022年度には,同一方向にある目的音に仮想焦点をあわせ,それ以外の音を一括して消去することができることを示した。これらに共通して「音源までの距離」の情報が重要であるため,2022年度から音源測距問題に取り組み,2023年度には複素スパースベイズ推定を導入することで5 mまでの複数音源について測距可能性を示した。その成果を,国内では情報処理学会・電子情報通信学会の研究会で,また国際会議ICICT 2024で報告した。 別の解法として,振幅スペクトルを音圧レベルで表示した非線形連立方程式をニューラルネットワーク(NN)により解くことを検討した。この件に関しては,直線上に配置したアレイに平面波が到来するという最も基本的な場合を取り上げ検討を行った。2雑音到来条件で時空間音圧分布画像のスペクトルをNNで学習することで,3雑音についても雑音低減効果があることを2022年度までに示した。 さらに,2020年度には,4個のマイクロホンを平面上に配置することで,立体角2π[sr]の空間における音源分離に適用できることも示した。 以上を総じて,スマートフォンに搭載可能な程度の小規模マイクロホンアレイにより,高精度に目的音を抽出することに成功したと考えている。
|