楽曲の階層住を表現できるモデル・手法のペンチマーク問題として,オーディオからの楽曲のセグメンテーションというタスクを取り上げて,オーディオからの楽曲セグメンテーションのための,コスト関数に基づく複数アプローチの組み合わせ手法を開発した. オーディオからの楽曲セグメンテーションは,特徴ベクトルの新奇性に基づくアプローチ,特徴ベクトルの同質性に基づくアプローチ.時系列の繰り返しに基づくアプローチの3アプローチに大別できる.従来の手法では,これらのアプローチ(の長所)を組み合わせた手法はほとんどない.唯一の例外として,確率的適合関数によるアプローチがあるが, (1)最適セグメンテーションは,探索アルゴリズムによって求められるので,計算的負荷が大きい,(2)特徴ベクトルの新奇性に基づくセグメント境界候補の選択が,全体の解に大きく影響する.などの問題点があった. これに対し,我々の提案手法は,3つのアプローチに対応した項の重み付け合計からなる複雑なコスト関数に関して,ダイナミックプログラミングを用いて(コストの低い)上位N交互を効率的に選ぶパス1と,上位N候補を正確に比較し,最もコストの低いものを選ぶパス2から構成される2パスアルゴリズムを用いており,従来手法のような問題点を持たない. 楽曲の階層性を表現できるモデルとしては,我々が従来より研究してきた階層隠れマルコフモデルなどが考えられる.しかし,学習データが少ない場合などにはこのようなモデルベース手法の適用は難しい.そのような場合には,このたび開発したセグメントに基づくダイナミックプログラミング手法や2パスアプローチなどが役立つものと考えられる.
|