2019 Fiscal Year Annual Research Report
分散ステレオマイクロフォンアレイに基づく音空間認識とその実世界応用
Project/Area Number |
19J20420
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
山岡 洸瑛 首都大学東京, システムデザイン研究科, 特別研究員(DC1)
|
Project Period (FY) |
2019-04-25 – 2022-03-31
|
Keywords | 分散マイクロフォンアレイ / 音響信号処理 / アレイ信号処理 / 時間差推定 / サンプリング周波数ミスマッチ推定 / 音源強調 |
Outline of Annual Research Achievements |
本研究課題では、複数のマイクロフォンを空間上に分散配置した、分散マイクロフォンアレイ(分散アレイ)を用いた音空間認識に取り組んでいる。また、音空間認識のための基礎技術として、空間上に存在する複数の音源信号の分離及び強調と音源位置情報の推定を統一的に行う技術の確立を目指している。これらの技術は、屋内環境において、移動検知に基づく高齢者の見守りシステムや、ライフログの収集など、様々なサービスの実現に大きく寄与することが期待される。 本年度は、分散アレイへと展開するための基礎理論として、まず、time-frequency-bin-wise switching (TFS) beamformerについて研究を進めてきた。これは2つのマイクロフォンのみを用いて、目的音源の劣化なく、複数の雑音を抑圧可能な技術であり、工学的有用性が高い。本提案手法に関して、音響信号処理分野のトップ国際会議であるICASSP 2019で口頭発表した他、同会議論文がIEEE Signal Processing Society Tokyo Joint Chapterより、Japan Student Conference Paper Awardを受賞した。 また、分散アレイにおける基本的な課題であるサンプリング周波数ミスマッチ問題に関しても研究を進めてきた。従来のミスマッチ推定法では、主に、相互相関の最大化による推定が提案されてきた。ここで、相互相関関数は非凸関数であることから、離散最大値付近の補間処理や探索アルゴリズムによる最大値の推定が行われてきた。これらに対し、本年度の研究では、連続の時間変数を持つ相互相関の最大化という最適化問題を考え、補助関数法に基づく新たな時間差推定法を提案し、同分野のトップ国際会議であるWASPAA 2019で口頭発表した。さらにこれを応用した新たなミスマッチ推定法も提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学術的な成果として、本年度は、国際会議論文3編(いずれもICASSP, EUSIPCO, WASPAAという音響信号処理分野のトップ国際会議)、国内学会発表2件という成果が得られた。また、IEEE Signal Processing Society Tokyo Joint Chapterより、優れた英語論文を発表したとして、ICASSPにおける国際会議論文がJapan Student Conference Paper Awardを受賞している。以上の研究成果より、本研究内容の学術的な重要性が高く評価されているといえる。また、提案しているTFS beamformerについてジャーナル論文を執筆中であり、次年度初頭に、国際ジャーナルへ投稿予定である。 また、新たに提案した補助関数法に基づく高精度な時間差推定法は、分散アレイにおいて重要な役割を果たすと考えている。分散アレイにおいては、多数のマイクロフォンを用いることから、必然的に多数の時間差を推定する必要がある。補間や探索に基づく従来の時間差推定法では、複数の時間差を一つずつ逐次的に推定する必要があった。一方で提案法の最適化問題は、複数の時間差を同時推定するための同時最適化問題への拡張を考えることができる。これにより、より高速かつ高精度な複数の時間差の推定が可能になると期待される。これは、分散アレイにおけるサンプリング周波数ミスマッチ推定にも応用可能であるなど、次年度以降の研究を進める上で極めて重要な位置を占める。以上の研究成果より、本研究課題はおおむね順調に進展しているといえる。
|
Strategy for Future Research Activity |
今年度は、2つのマイクロフォンを用いた信号処理について研究を進めてきた。次年度は、これを分散アレイに拡張するため、3つ以上の分散配置されたマイクロフォンへの展開を考える。具体的には、まず、提案している補助関数法に基づく時間差推定法を拡張し、複数時間差の同時推定問題を考える。提案法においては、時間差を変数とした相互相関の最大化問題を解いているため、複数の時間差変数をベクトルの要素として考えることで、自然に複数時間差の同時推定を考えることができる。これは、従来の補間や探索に基づく手法では困難であり、分散アレイにおける信号処理の実現のための重要な要素技術である。さらに、これを用いて、分散アレイにおける音源強調法を提案する。これは提案している、単一ステレオマイクを用いたTFS beamformerを拡張する形での定式化が考えられる。特に、本研究では分散ステレオマイクロフォンアレイに着目していることから、複数のステレオマイクに基づく音源強調として、TFS beamformerを再定式化する。また、3年目では、これまでに提案してきた分散ステレオマイクアレイに基づく手法を応用し、実環境における音空間認識の実現を目指す。具体的には、近年普及しているスマートスピーカを拡張したスマートホームを考え、家の中どこにいても AIとの対話が可能なシステムを想定し、分散アレイによる音源強調と音源位置の推定を統合した音空間認識技術の確立を目指す。
|
Research Products
(5 results)