2017 Fiscal Year Annual Research Report
Outdoor sound collection for auditory scene analysis in a daily life and its applications
Project/Area Number |
15K00255
|
Research Institution | Osaka Sangyo University |
Principal Investigator |
高橋 徹 大阪産業大学, デザイン工学部, 准教授 (30419494)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 音源分離 / 音声強調 / 非負値行列因子分解 / マイクロホンアレイ / ロボット聴覚 |
Outline of Annual Research Achievements |
日常生活音は,屋内外を問わず音と音が混合するシーンに遭遇する.本課題では,混合音を観測し、観測信号から各音源への分解を実現する方法を開発することである.特に,日常生活空間すなわち複数の音がありかつ残響がある音環境において実現することを検討してきた.特に劣決定条件(音源数が観測マイクロホン素子数より多い条件)では,時間・周波数・空間情報いずれを用いても音源間の干渉を避けることが困難である.統計的独立性を利用する音源分離や,空間情報の差を利用する音源分離を用いても干渉を除去することが難しい.日常生活空間での音環境理解に必要な技術は,単一チャネルに適用可能な音源分離手法である. 平成29年度は,単一チャネルで観測した混合音から特定の音源情報を強調する手法を開発した.非負値行列因子分解と音声スペクトル分析を統合した信号モデルを用いた.具体的には,非負値行列因子分解と音声スペクトル分析に用いる評価尺度を双方とも板倉斎藤歪尺度を用いた後,これらを統合一し,統一尺度の下で最適化するアルゴリズムを導出した.これにより基底ベクトルには音声スペクトルモデルに当てはまるベクトルを獲得可能となった.提案非負値行列因子分解アルゴリズムで観測信号のパワースペクトルを分解することで,狭帯域雑音の干渉を受けにくい音声の基底ベクトルを推定可能となり,基底ベクトルとそのアクティベーションの積を用い音声強調可能になった. 本成果により,日常生活空間で,マイクロホンアレイを用いた音源分離結果に残留する干渉を除去する手段を提供可能となった.従来から数多くの音源分離手法が研究開発されてきたが,音声と非音声の混合を扱うことが多く,音声と音声の混合を扱くことが少なかった.本成果は,複数スペクトルモデルを同時に扱うことが可能な枠組みであり,この点については今後検討が必要であるものの,新たな研究課題を明らかしたといえる.
|
Research Products
(10 results)