本研究では、楽譜(離散データ)に対する言語モデルと、音響信号(連続データ)に対する音響モデルを統合した階層ベイズモデルを定式化し、音響信号だけから、その背後に存在する楽譜や文法構造を一挙に推定する技術を確立した。具体的には、ピアノ演奏の音響信号に対する自動採譜、歌声の音高軌跡に対する音符推定、MIDI演奏信号に対するリズム採譜、ポピュラー音楽の音響信号に対するドラム採譜およびギター譜生成に取り組んだ。開発した自動採譜・音源分離技術を用いて、歌唱・楽器演奏支援システムの開発を行った。さらに、コードとメロディの階層ベイズモデルに基づく、インタラクティブな作曲支援システムを開発した。
|