研究課題/領域番号 |
14J10796
|
研究機関 | 総合研究大学院大学 |
研究代表者 |
北村 大地 総合研究大学院大学, 複合科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2014-04-25 – 2017-03-31
|
キーワード | 音源分離 / 音メディア信号処理 / 非負値行列因子分解 / 多チャネル |
研究実績の概要 |
本研究は,音メディアを対象とした拡張現実感システム(音ARシステム)の構築を最終的な目標としており,頑健に動作する教師無し及び教師あり音源分離技術の基礎的な理論構築及びマルチチャネル信号への拡張をを行う.このような音源分離技術は,補聴器等の人支援デバイスや高臨場感音場再現技術,既存の音楽の能動的な鑑賞(ユーザによるリマスタリング)など多岐にわたる応用が可能である他,混合信号の中の潜在的な因子を解析する技術として,学術的にも極めて重要である.研究実施1年目では,マルチチャネル信号を対象とした極めて効率的な教師無し音源分離アルゴリズムを新たに提案しており,トップ国際会議への採択や当該成果に関する受賞等から,その学術的な価値が認められつつある. 2年目では,1年目で提案したマルチチャネル音源分離手法の数理的なメカニズム(音源の周波数構造を捉える機構及び空間的な伝達系を捉える機構)を詳しく解析し,トイモデルを用いて従来のstate-of-the-artな手法(独立ベクトル分析)からの数理的な拡張である事実を明確に示した.この成果は1年目の成果とまとめて国際論文誌へ投稿済みである.また,異なるアプローチである教師ありの音源分離手法として,分離対象音源固有の周波数構造を捉えるように教師情報(音源固有のスペクトル構造)を変形・適応することで,より高精度なモノラル音源分離を実現する手法を新たに提案している.また,国際会議への投稿を予定しており,現在原稿を投稿中である.この他にも,教師あり及び教師無し音源分離手法の基盤数理アルゴリズムである非負値行列因子分解に関して,効率的な最適化を可能にする初期値の決定法に関しても取り組んでおり,同様に国際会議原稿を現在執筆中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初の研究計画では,教師あり音源分離に関する性能向上を最も大きな課題としており,分離目的音の教師信号(サンプル音等)から得られた教師スペクトル情報をより効率的に分離ができるように変形及び適応することを計画していた.現在の状況は,次の通りである. 研究実施1年目に,非常に効率的な教師無し多チャネル音源分離手法を提案し,従来の最先端技術の最高性能を大きく上回っていることを示した.また2年目では,当初の計画通り教師あり音源分離手法に着目し,分離目的音の教師スペクトル情報をより識別的な構造に適応的に変形する手法を提案した.識別的な構造に変形させることで,非目的音源のスペクトル成分とのオーバーラップを避けることができ,学習した教師情報が他の音源を表現してしまう問題を解決している.音楽信号を用いた分離実験の結果,本手法は従来の教師あり音源分離手法の性能を大きく上回ることが確認され,その妥当性を客観的に示すことができている. これらの教師無し及び教師あり音源分離手法は,統合することが可能であり,その場合は一般的な音楽信号のようにステレオ(2チャネル)で録音された信号に対して適用することが可能となる.また,補聴器や音場再現技術を対象とした場合も同様に適用可能である.このように単一チャネルと多チャネルの両方の問題について同時に取り組むことができており,当初の計画よりも大きく進展した進捗状況となっている.
|
今後の研究の推進方策 |
研究実施2年目で提案した教師あり音源分離手法は,より識別的な教師情報を学習するために,学習済みの教師情報を,目的音源固有のスペクトル成分を捉えるように変形・適応する手法であり,確実に分離精度が向上することを客観的に示している.しかしながら,現状では変形・適応の数理的な最適化部分を近似的に解いているため,性能向上が最適化の途中で止まってしまうという現象を実験的に確認している.従って,3年目ではまず,前述の最適化の厳密な解を数値計算によって求めることで,従来法からの性能向上の上限を確認する.さらに,そのような解を推定する新しい最適化アルゴリズムについて考察し,現実的に応用可能な手法へと改良することを目標とする.さらに,1年目で提案した多チャネル音源分離手法と統合することで,具体的な音源分離システム(補聴器,ロボット,及び簡易なソフトウェア等)への導入の可能性について検討する.
|