本研究では,人間の聴覚上かつ機械の認識上の両方において,高品質な音源分離システムの構築を最終的な目標としており,信号処理・機械学習・聴覚にまたがる数理モデルの構築と拡張を行った.最終年度では,主に以下の研究課題に取り組んだ. 1.昨年度までに提案した多チャンネル音源分離手法である多チャンネル変分自己符号化器法の高速アルゴリズム(FastMVAE法)の改良を行い,従来のFastMVAE法における未知データに対する性能劣化の問題を改善し,より高精度かつ高速なアルゴリズムを開発した.その結果はIEEE Accessに掲載された.本研究はIEEE Signal Processing Society Japan Chapterにより高く評価され,Student Conference Paper Awardを受賞した. 2.実験データを増やして,初年度に進めた非負値行列因子分解に基づく音声強調手法である識別的非負値行列因子分解(DNMF)の性能および動作を確認した.その結果をまとめた論文はIEEE Accessに掲載された. 3.昨年度に補助関数法を用いた独立ベクトル分析(AuxIVA)と呼ぶ多チャンネルブラインド音源分離手法にマイクと話者の空間情報を利用した幾何的正則化を取り入れたGCIVAを提案した.本年度は,実用化アプリケーションに向けて,提案手法のオンラインアルゴリズムの開発を行い,提案手法はリアルタイム処理で高性能な音声強調を行えることをシミュレーション実験で検証した.その結果をまとめた論文をトップカンファレンスであるINTERSPEECH2020で発表した.また,実環境における提案法の有効性も車室内で録音したデータにより検証した. 4.実用アプリケーションを目指し,AuxIVAおよびGCIVAのオンラインアルゴリズムを小型パソコンJetson Nanoに実装し,動作を確認した.
|