研究課題
本研究課題は,音源分離技術に関する数理的・実用的拡張を目的としている.音源分離とは,複数の音源が混合した観測信号のみから混合前の個々の音源信号を推定する逆問題であり,スマートスピーカーや電話通信,音声認識,補聴器デバイス,音響VR・AR等,多くの応用が期待されている.平成29年度は,従来より申請者が提案している独立低ランク行列分析(ILRMA)の確率的生成モデルの一般化について,当初の計画通り取り組み,従来のILRMAの利点である高速な最適化・初期値に対する頑健性を保ったまま,より高精度な音源分離結果が得られることを実験的に示した.また,低ランク性以外の性質や,音源にとって適切な性質を学習データと深層学習によって獲得する「独立深層学習行列分析(IDLMA)」を新たに提案した.平成30年度は,IDLMAのデータ拡張タスクについて取り組んだ.IDLMAにおいて音源モデルを事前に構築するためには,学習データとして完全に分離された音源信号が大量に必要となる.現実的には,そのような学習データを用意できる状況は非常に稀であるため,より少ないデータからその特質を捉え,音響的に適切な制約の下で音源信号を新たに生成する方法について提案した.これは即ち,少数のデータから深層ニューラルネットワークを転移学習する「半教師ありIDLMA」と捉えられる.このような拡張は,より現実の問題解決に即したアルゴリズムといえる.この半教師IDLMAについて実験的に性能を確認したところ,事前学習データを大量に利用する全教師ありIDLMAと同程度の音源分離が達成できることを確認した.これらの成果については,現在論文を投稿中である.
平成30年度が最終年度であるため、記入しない。
すべて 2019 2018 その他
すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (24件) (うち国際学会 9件、 招待講演 1件) 備考 (2件)
IEEE Signal Processing Letters
巻: 印刷中 ページ: 印刷中
10.1109/LSP.2019.2909079
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
巻: E102.A ページ: 458~463
10.1587/transfun.E102.A.458
EURASIP Journal on Advances in Signal Processing
巻: 2018 ページ: 1~28
10.1186/s13634-018-0549-5
http://d-kitamura.net/demo_idlma.htm
http://d-kitamura.net/en/demo_idlma_en.htm