研究課題
挑戦的研究(萌芽)
本研究の目的は、音声・音楽・環境音など多岐にわたるあらゆる種類の音を、適応的かつ頑健に分析できるユニバーサル音響理解モデルを確立することである。具体的には、最近我々が提案した、高速かつ高精度な最新の汎用ブラインド音源分離 (BSS) 手法である高速多チャネル非負値行列因子分解 (FastMNMF) に関して、音源モデル・空間モデル・尤度関数の改良を行い、分離モデルや残響モデルとの同時学習を実現した。また、音声認識との統合についても取り組んだ。
音響信号処理
本研究を通じて、人間が持つ音理解能力の創発的な側面、すなわち、正解の教示を受けなくても、多様な音が重畳する実環境とのインタラクションを通じて、音を個別に理解する能力に対し、一定の構成論的説明と統計的エビデンスを与えることができた。技術的には、ペアデータを前提とした深層学習モデルの教師あり学習から脱却し、尤度最大化の枠組みに基づく教師なし学習を主軸とすることで、大規模な音響信号データ利用への道筋を開いた。