2018 Fiscal Year Annual Research Report
Extended theories of audio source separation based on statistical independence and various mathematical structures
Project/Area Number |
17H06572
|
Research Institution | Kagawa National College of Technology |
Principal Investigator |
北村 大地 香川高等専門学校, 電気情報工学科, 助教 (40804745)
|
Project Period (FY) |
2017-08-25 – 2019-03-31
|
Keywords | 音響信号処理 / 統計的信号処理 / 最適化 / 音源分離 |
Outline of Annual Research Achievements |
本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,スマートスピーカーや電話通信,音声認識,補聴器デバイス,音響VR・AR等,多くの応用が期待されている. 平成29年度は,従来より申請者が提案している独立低ランク行列分析(ILRMA)の確率的生成モデルの一般化について,当初の計画通り取り組み,従来のILRMAの利点である高速な最適化・初期値に対する頑健性を保ったまま,より高精度な音源分離結果が得られることを実験的に示した.また,低ランク性以外の性質や,音源にとって適切な性質を学習データと深層学習によって獲得する「独立深層学習行列分析(IDLMA)」を新たに提案した. 平成30年度は,IDLMAのデータ拡張タスクについて取り組んだ.IDLMAにおいて音源モデルを事前に構築するためには,学習データとして完全に分離された音源信号が大量に必要となる.現実的には,そのような学習データを用意できる状況は非常に稀であるため,より少ないデータからその特質を捉え,音響的に適切な制約の下で音源信号を新たに生成する方法について提案した.これは即ち,少数のデータから深層ニューラルネットワークを転移学習する「半教師ありIDLMA」と捉えられる.このような拡張は,より現実の問題解決に即したアルゴリズムといえる.この半教師IDLMAについて実験的に性能を確認したところ,事前学習データを大量に利用する全教師ありIDLMAと同程度の音源分離が達成できることを確認した.これらの成果については,現在論文を投稿中である.
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
Research Products
(29 results)