2010 Fiscal Year Annual Research Report
Project/Area Number |
09J10015
|
Research Institution | Meiji University |
Principal Investigator |
藤枝 大 明治大学, 大学院・理工学研究科, 特別研究員(DC2)
|
Keywords | 自動採譜 / 多重音高推定 / 機械学習 / サポートベクターマシン / スペクトル密度推定 / EMアルゴリズム |
Research Abstract |
平成22年度は、以下の内容を実施した。 1、サポートベクターマシン(SVM)を用いた多重音高推定の理論的検証 提案の主たる部分は、サポートベクターマシンで単音だけを学習し、和音を識別することである。この提案に対して、音楽音響的な立場から考察した。この結果、提案法の妥当性を示し、多少の制約を加えればその仮説が数学的に成立することを示した。この妥当性は、実験でも示されている。学習と認識を大幅に向上させ、3和音以下で93.4%以上、4和音で88、1%の正解率という、現存する手法とほぼ同等の精度を得た。 2、SVMを用いた多重音高推定における同時発音数の推定 理論的な検証を行ったことにより、評価値の振る舞いが明瞭になった。この結果を利用して、選択する評価値を決定するための閾値を同時発音数によって変更させることを提案した。閾値を決めるためには目的である同時発音数が必要となるが、これは評価値の分布の統計量から暫定的に決定する。以上の閾値を導入したSVMによる多重音高推定は、閾値導入前よりも正解率が3%程度向上した。 3、ヒトの感覚に基づいた周波数解析の検討 ヒトの感覚の特性を利用した新しい周波数解析手法を検討した。聴覚;フーリエ変換は些細な成分も見逃すことなく分析するが、ヒトは弱すぎる周波数成分を感じられないため,そのような弱い成分は無視できるとした。視覚:ヒトは、紙面に印刷された周波数スペクトルを見て、調波構造に対応する大まかな特徴を見極めることができる。これと同じことをするために、本手法ではスペクトル密度を混合正規分布とみなし、EMアルゴリズムを用いてパラメータの推定を試みた。この手法を定量的に評価するために、推定したパラメータを用いた3和音の多重音高推定を試みた結果、98%前後の精度が得られた。このことから、主要なピーク周波数を適切に推定できていることがわかる。さらに、推定したパラメータを用いた結合音のパワーの推定を試みた結果、該当する周波数のパワーを得ることができた。
|
Research Products
(3 results)