• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

圧縮ドメインにおける楽曲アノテーションに関する研究

研究課題

研究課題/領域番号 21500097
研究機関電気通信大学

研究代表者

星 守  電気通信大学, 情報システム学研究科, 教授 (80125955)

研究分担者 小早川 倫広  東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (00334582)
キーワード楽曲アノテーション / 楽曲検索
研究概要

課題1:楽曲にジャンルタグを付加するアノテーション技術の開発としては,楽曲を短時間(数十秒程度)の部分に分割し,分割された部分楽曲に対するジャンル分類を試みた.具体的には,バロック,ボサノバ,ダンス,ヒップホップ,ジャズ,マーチ,オールディーズ,ロック,タンゴ,ワルツの10種類のジャンル,計2,196曲にTwinVQ圧縮を実行し圧縮データを用意した.さらに,各楽曲のビットストリームを2048フレーム(48秒相当の長さ)毎に分割し,各部分楽曲に対してジャンルアノテーションを行い,ジャンル分類性能を求めた.先行研究からLPCケプストラムが,ジャンル分類に有効であることがわかっているため,圧縮データ中のLSPパラメータから算出されるLPCケプストラム列を用いた.LPCケプストラム列を2048フレーム(48秒相当)毎に分割し,長さ2048フレームのLPCケプストラム列に対して,ウェーブレット変換による多重解像度解析を実行し,ウェーブレット変換を用いた特徴量を算出した.算出した楽曲特徴量によるジャンル分類の性能を評価するため,部分楽曲全体をトレーニングデータ、テストデータに分け判別分析を行った.トレーニングデータでの平均ジャンル分類正答率88.5%,テストデータでの平均ジャンル分類正答率82.3%が得られ,提案した特徴量は楽曲ジャンル分類のための特徴量として有効であることが分かった.
課題2:楽曲の部分にタグを付加するための楽曲構造に基づくアノテーション技術の開発としては,ビットストリームに格納されているLSPパラメータ,LSPパラメータから算出される線形予測係数,LPCケプストラム,自己相関係数などを用いた楽曲の繰り返し構造抽出を試みた.しかし,構造抽出対象曲としてハードロックとしたため,楽譜上では繰り返しとして表現されていても,繰り返し区間の演奏時間が違い繰り返しとして抽出できないという問題が現れ,楽曲繰り返し構造抽出として良好な結果を得ることができなかった.

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi