2018 Fiscal Year Annual Research Report
Formulation of a recording method of the entire sound field by the fusion of acoustical signal processing and artificial intelligence technology
Project/Area Number |
16K06384
|
Research Institution | University of Yamanashi |
Principal Investigator |
小澤 賢司 山梨大学, 大学院総合研究部, 教授 (30204192)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 修一 東北大学, 電気通信研究所, 准教授 (60332524)
森勢 将雅 山梨大学, 大学院総合研究部, 准教授 (60510013)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | マイクロホンアレイ / 時空間音圧分布画像 / 2次元フーリエ変換 / 3次元フーリエ変換 / 音源分離 / スペクトル減算法 / ニューラルネットワーク / 距離分離 |
Outline of Annual Research Achievements |
全空間中の各音源を選択的に収録することを目的とする。アレイを構成する各マイクロホンにおいて観測された時系列としての音圧の標本値を,輝度値に変換することで画像を生成し,この画像を全てのマイクロホンについて並べることで構成した画像を「時空間音圧分布画像」と定義した。この画像を2次元フーリエ変換して得た2次元振幅スペクトルにおいては,到来方向が異なる平面波は,傾きが異なる直線上の成分として出現する。その傾きに基づいて音の到来方向推定が可能であり,さらには各直線上の成分のみを抽出し逆フーリエ変換することで音源分離が可能である。以上を原理として検討を進めてきた。 3年間の研究期間において,全てのマイクロホンに同時に到達する音については,スペクトルが空間方向の直流成分に局在するという大きな特徴があることに気づき,この性質を積極的に利用することとした。2次元スペクトルから消去すべき音の情報を推定するために人工知能技術を利用した。本年度は,以下3点について検討を行った。 1.スペクトルの瞬時推定による音源分離方法の開発:平成29年度の検討により,目的音に混入した雑音成分を周波数ごとに推定する手法を考案した。平成30年度は,その手法を実装し,従来法に比べて簡単な信号処理で十分な性能が得られることをを示した。 2.平面アレイへの拡張:上記の手法を2次元アレイに拡張し,3次元画像に対して3次元フーリエ変換することで,立体角2πの空間における音源分離が可能であることを示した。 3.距離方向の分離:マイクロホンを円弧上に配置したアレイを用いると,その中心位置(アレイの焦点)から放射された球面波は,全てのマイクロホンに同時に到達する。それゆえ,焦点位置からの音を2次元スペクトルにおいて空間方向の直流成分に局在させることが可能であり,音源分離も可能である。計算機実験により,十分な分離性能が得られることを示した。
|
Remarks |
・小澤賢司, "次世代SNSは音声ズームが主役になる?," 平成30年度やまなし産学官連携研究交流事業 研究発表会 (2018/10/17). ・小澤賢司, "焦点位置からの音のみを収録するスマホサイズのアレイ," 山梨大学新技術説明会 (2018/12/6).
|
Research Products
(10 results)