研究概要 |
研究課題の目的は,楽曲圧縮ドメインにおける楽曲内容に基づいた楽曲へのアノテーション技術の開発である.本研究課題は,国産のMPEG-4 Audio規格であるTwinVQ楽曲圧縮に着目し,楽曲圧縮過程中に算出される,あるいは圧縮データのビソトストリームに格納されているパラメータを用いた楽曲へのアノテーション,およびアノテーションに基づいた楽曲検索手法に関する研究を行うというものであった.本年度の課題は,1)楽曲構造に基づくアノテーション技術の開発,2)楽曲への印象語アノテーション技術の開発であった. 楽曲構造に基づくアノテーション技術の開発としては,TwinVQ圧縮過程で算出される自己相関係数列に着目し,自己相関係数列から,楽曲を分割するための分割長の抽出手法,抽出した分割長を用いた楽曲分割手法,楽曲分割手法によって分割された楽曲の各区間の繰り返しに着目した楽曲の階層構造抽出手法を提案した.この研究成果を国際会議IEEE PCM2010で発表した. 楽曲への印象語アノテーション技術の開発としては,TwinVQ圧縮データのビットストリームに格納されているLSPパラメータに着目し,LSPパラメータ系列に対してウェーブレット変換を施し,ウェーブレット係数に基づいた楽曲特徴量による印象語付加の評価実験を行った.評価実験として,「明るい」,「落ち着く」,「楽しい」,「穏やか」,「寂しい」,「騒がしい」の6つの印象語に対して,それぞれ68曲,140曲,52曲,74曲,24曲,52曲を用意し,評価実験を行った.評価実験の結果,印象語アノテーションとして60.45%の正答率を得た.平成23年度では,LSPパラメータから算出されるLPCケプストラム列,自己相関係数列などから抽出した特徴量に対して,印象語アノテーションの評価実験を行う予定である.
|