2012 Fiscal Year Annual Research Report
ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離
Project/Area Number |
23700184
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
吉井 和佳 独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (20510001)
|
Keywords | 音楽情報処理 / 機械学習 / ノンパラメトリックベイズ |
Research Abstract |
本研究の目的は、音楽音響信号データに対して音源分離と構造学習を同時的に行うための統一的なノンパラメトリックベイズモデルの提案である。平成24年度は主に、「音響データに対する音源分離」に関する技術開発を行った。具体的には、市販CDのように様々な音色および音高から構成される混合音を楽器パート(音色)ごとに分離するための確率モデルについての研究を行った。従来、混合音の音源分離のための標準的な方法である非負値行列分解 (NMF) では、混合音を音高ごとに分離することができても、音色ごとに分離することはできなかった。そのため、分離された楽器音を音色ごとにクラスタリングする処理が別途必要であった。本研究では、ソース・フィルタ理論に基づいて、混合音中に含まれる楽器音の音色と音高とを一挙に推定することを可能にした。このとき、音色と音高の個数は未知であるため、理論上可算無限個の音色と音高とが存在することを許容するノンパラメトリックベイズモデルを提案した。実験の結果、改善の余地はあるものの、ポピュラー音楽の音響信号をベース・ボーカル・ギター・ドラムなどの楽器パートに分離できることを確認した。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIRにて発表を行った。このアイデアをさらに発展させることで、無限カーネル線形予測分析や無限半正定値テンソル分解とよぶ音響信号解析のための新しい確率モデルを提案することができた。これらの研究成果はそれぞれ、信号処理分野および機械学習分野のトップカンファレンスであるICASSPおよびICMLにて採択されている。このように、平成24年度には音響信号の解析について予想以上の進展が見られた。さらに、平成23年度に開発した「楽譜データに対する構造学習」に関する技術を確率的な枠組みのもとで統合する方法について予備的な実験を行うまで研究を進めることができた。
|
Research Products
(7 results)