本研究の目的は、音楽音響信号データに対して、音源分離と構造学習を教師なしで同時に行うためのノンパラメトリックベイズモデルの提案である。 まず、(1) 「楽譜 (記号データ) に対する構造学習」に関する研究を行った。和音とは本来、C major や D minorなどのコードラベルが付与されているものに限定されているわけではなく、あらゆる音高の組み合わせが和音を形成しうると考えるのが自然である。このことから、語彙として可算無限種類の和音が与えられたときに、それらの生成確率と遷移確率とを統一的に記述することができる確率モデルを提案した。さらに、(2) 「信号(音響データ)に対する音源分離」に関する研究を行った。具体的には、市販 CD のように様々な楽器の音色や音高から構成されるモノラルの混合音を、従来のように音高ごとではなく、楽器パート(音色)ごとに分離するため、ソース・フィルタ理論と非負値行列分解に基づく確率モデルを提案した。今後の課題は、各確率モデルを洗練させていくとともに、両者の様々な統合の方式についてさらに検討を進めていくことである。
|