2014 Fiscal Year Annual Research Report
スパース信号分解に基づく多次元音響メディア情報処理及びその音拡張現実感への応用
Project/Area Number |
14J10796
|
Research Institution | The Graduate University for Advanced Studies |
Principal Investigator |
北村 大地 総合研究大学院大学, 複合科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2014-04-25 – 2017-03-31
|
Keywords | 音源分離 / 音響信号処理 / 非負値行列因子分解 / 独立成分分析 / 多チャネル信号処理 / アレー信号処理 |
Outline of Annual Research Achievements |
本課題では,多チャネル音響信号を対象とした情報処理に取り組んでいる.具体的には,複数のマイクを並べたマイクアレイで録音された音響信号や,ステレオ音楽信号等を対象とし,複数の話者音声や複数の楽器音が混合した状態で録音された信号を,音源毎に分離する手法の提案を目標としている.この音源分離技術は様々な技術に応用可能である.例えば,音楽信号を対象とした場合,ユーザが既存の音楽作品を再編集する等の能動的な音楽鑑賞が可能となる他,複数のスピーカを用いた高臨場感再現技術における音源の空間的な配置を,音源毎に操作するといったことへも応用できる.さらに,話者と背景雑音の分離を対象とした場合,補聴器等の人支援デバイスへの応用も期待できる. 今年度は特に,従来研究されてきた「ブラインド音源分離(BSS)」に重点をおいて研究を進めた.BSSは,音源位置や各マイク位置等の事前情報を用いずに,複数マイクで観測された多チャネルの混合音響信号のみから音源分離を行う技術である.多くの応用技術が考えられ,実現されれば大変有益となる技術課題である.近年,多チャネル非負値行列因子分解(MNMF)が提案され,高精度で音源分離が可能であることが報告されている.しかし,MNMFは極めて高い計算コストを必要とし,かつ頑健に動作させることが困難という問題がある.今年度は,MNMFに,収録環境に関する制約を導入することで,効率的に解く手法を提案した.提案法では,計算時間を20分の1以下にまで削減でき,MNMFの最高性能と同程度の音源分離を頑健に達成することができる. 本提案手法に関しては,音響信号処理分野のフラッグシップ国際会議ICASSP 2015に採択されている.また,日本音響学会より,音響に関する学問及び技術の奨励のため,有為と認められる新進の研究・技術者に送られる第37回粟屋潔学術奨励賞を受賞している.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
音源分離技術は,多チャネル音響信号処理分野において,近年世界中で盛んに研究されている課題である.2013年に提案された多チャネル非負値行列因子分解(MNMF)は,従来手法と比較して最も高精度に音源分離を達成しており,現在世界的に注目されている手法の一つといえる.このMNMFは,極めて高い計算コストと頑健性の欠如が大きな問題となっており,国内外の多くの研究者が,これらの問題の解決に取り組んでいるのが現状である. 申請者は,従来の最先端技術であるMNMFに,音源の空間的な伝播情報に対応する制約条件を導入することで,MNMFと同程度の性能を保ちつつ計算量をおよそ20分の1程度に削減した画期的な音源分離アルゴリズムを新たに提案している.そしてこの成果は,音響信号処理分野のトップカンファレンスであるICASSP 2015に採録されていることや,日本音響学会の粟屋潔学術奨励賞を受賞していることから,その学術的な重要性が高く評価されていることがわかる. また,本提案手法の問題点を改めて考察し,特定の条件下においてその問題点を解決する拡張アルゴリズムも提案している.以上の研究成果より,当初の計画以上の十分な研究の進展があったと考えられる.
|
Strategy for Future Research Activity |
今年度は,マイクアレイで収録された信号に対する音源分離手法について研究を進めてきた.しかしながら,提案手法の根本的な問題として,音源の数がマイクの数よりも多い場合においては,提案手法を適用することができない.そこで今後の研究の推進方策として,音源の数がマイクの数よりも多くなるような悪条件の状況においても,高精度に音源を分離する手法の提案を目指す.具体的には,分離対象となる音源の音響的特徴(音色構造や時間変化等)に着目し,比較的近いサンプル音源を教師情報として与えることで,目的音源の抽出する手法である.このようなあ教師あり音源分離手法は,私が修士の時代に研究していた内容を応用することができるため,十分に実現可能な目標であると考えられる.さらに3年目では,これまでに提案した音源分離手法を用いて,音拡張現実感への応用を試みる.具体的には,音場再現技術や補聴器技術への適用をめざし,それぞれの応用技術特有の問題(計算時間や制約条件等)の解決を目指す.
|
Research Products
(4 results)