Research Abstract |
研究課題の目的は,楽曲圧縮ドメインにおける楽曲内容に基づいた楽曲へのアノテーション技術の開発である.本研究課題では国産のMPEG-4 Audio規格であるTwinVQ楽曲圧縮に着目し,楽曲圧縮過程中に算出される,あるいは圧縮データのビットストリームに格納されているパラメータを用いた楽曲へのアノテーション,およびアノテーションに基づいた楽曲検索手法に関する研究を行うことであり,本年度の課題は,楽曲への印象語アノテーション技術の精度を高めるというものであった. 昨年度,楽曲への印象語アノテーション技術の開発として,TwinVQ圧縮データのビットストリームに格納されているLSPパラメータに着目し,LSPパラメータに基づいた楽曲特徴量による印象語付加の評価実験を行った.印象語6語,被験者1人における評価実験では,印象語付与として60.45%の正答率を得た. 本年度は,10対の印象語「陽気な-陰気な」,「うきうきした-しんみりした」,「楽しい-悲しい」,「コミカルな-泣ける」,「激しい-穏やかな」,「にぎやかな-静かな」,「騒がしい-落ち着いた」,「軽い-重い」,「力強い-弱々しい」,「明るい-暗い」を用いて,被験者5人が1416曲に対して印象語を付与した.圧縮楽曲データからは,LSPパラメータ系列に対して,ウェーブレット変換を実行し,ウェーブレット分解の各レベルにおいて,近似係数列の平均と標準偏差,差分係数の平均と分散を算出した.算出された近似係数の平均と分散,差分係数の平均と分散の組み合わせることにより,楽曲特徴量ベクトルを生成した.さらに,楽曲特徴ベクトルと被験者の楽曲に対する印象を結びつけるため,判別分析を用いた.ただし,判別分析に用いるトレーニングデータの数を各印象語に対して,20曲とし,それ以外のデータをテストデータとした.本実験では,被験者により判別率に多少の差があるが,判別率として最も悪い被験者でも80.1%,被験者5人の平均として84.6%を得た.このことは,圧縮ドメインにおいて楽曲に印象語を付与できたことを示している.
|