研究概要 |
課題1:楽曲にジャンルタグを付加するアノテーション技術の開発としては,楽曲を短時間(数十秒程度)の部分に分割し,分割された部分楽曲に対するジャンル分類を試みた.具体的には,バロック,ボサノバ,ダンス,ヒップホップ,ジャズ,マーチ,オールディーズ,ロック,タンゴ,ワルツの10種類のジャンル,計2,196曲にTwinVQ圧縮を実行し圧縮データを用意した.さらに,各楽曲のビットストリームを2048フレーム(48秒相当の長さ)毎に分割し,各部分楽曲に対してジャンルアノテーションを行い,ジャンル分類性能を求めた.先行研究からLPCケプストラムが,ジャンル分類に有効であることがわかっているため,圧縮データ中のLSPパラメータから算出されるLPCケプストラム列を用いた.LPCケプストラム列を2048フレーム(48秒相当)毎に分割し,長さ2048フレームのLPCケプストラム列に対して,ウェーブレット変換による多重解像度解析を実行し,ウェーブレット変換を用いた特徴量を算出した.算出した楽曲特徴量によるジャンル分類の性能を評価するため,部分楽曲全体をトレーニングデータ、テストデータに分け判別分析を行った.トレーニングデータでの平均ジャンル分類正答率88.5%,テストデータでの平均ジャンル分類正答率82.3%が得られ,提案した特徴量は楽曲ジャンル分類のための特徴量として有効であることが分かった. 課題2:楽曲の部分にタグを付加するための楽曲構造に基づくアノテーション技術の開発としては,ビットストリームに格納されているLSPパラメータ,LSPパラメータから算出される線形予測係数,LPCケプストラム,自己相関係数などを用いた楽曲の繰り返し構造抽出を試みた.しかし,構造抽出対象曲としてハードロックとしたため,楽譜上では繰り返しとして表現されていても,繰り返し区間の演奏時間が違い繰り返しとして抽出できないという問題が現れ,楽曲繰り返し構造抽出として良好な結果を得ることができなかった.
|