2011 Fiscal Year Research-status Report
ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離
Project/Area Number |
23700184
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
吉井 和佳 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (20510001)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 音楽情報処理 / 機械学習 / ノンパラメトリックベイズ |
Research Abstract |
本研究の目的は、音楽音響信号データに対して音源分離と構造学習を同時的に行うための統一的なノンパラメトリックベイズモデルの提案である。平成23年度は主に、「楽譜データに対する構造学習」に関する研究を行った。具体的には、C majorやD minorなどといったコードラベルが付与されていない和音(複数の音符の同時発音)の系列を確率モデルで表現することに取り組んだ。従来、この種の問題においては、隣り合う和音には依存関係があることからn-gramモデルを利用するのが一般的であり、nの値を固定し、語彙として和音の種類(コードラベル)は事前に定めるものとされていた。しかし、現実には様々な長さの典型的なコードパターンが存在し、日々新しいコードが確立されていることを考えると、そのような仮定は適切ではない。本研究では、ノンパラメトリックベイズモデルを用いて、nの値を系列中の各和音ごとに可変とし、無限種類の和音を扱うことを可能にした。実験の結果、後続の和音の予測精度が向上することを確認した。これは、人間が音楽的なセンスを経験的に獲得するのと同様に、教師なしで音楽の構造を理解する計算機を構築する上で、非常に重要な成果である。本研究成果は、それぞれ音楽情報処理分野および信号処理のトップカンファレンスであるISMIRおよびICASSPにて登壇発表を行った(後者は特別セッションにおける招待講演)。さらに、機械学習分野のトップカンファレンスであるNIPS併設のワークショップMMLにおいても登壇発表を行った。一方、「音響データに対する音源分離」に関する検討もすでに開始している。具体的には、自らのこれまでの研究成果である、音響信号中に無限個の音源が含まれていることを理論上許容する無限潜在的調波配分法をヒントに、より高精度かつ学習の際の初期値依存性が低いモデルを構築することができる見込みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画書には、平成23年度は「音響データに対する音源分離」と「楽譜データに対する構造学習」を行うと記載されている。研究実績の概要に記述した通り、おおむね目標を達成できている。研究成果は著名な国際会議にて発表することができており、成果の発信の点においても順調である。
|
Strategy for Future Research Activity |
平成24年度は、音楽音響信号データおよび楽譜データに対する確率モデルを洗練化すると同時に、その統合についても検討を進める。両者のモデルを同時的に学習するうえでは様々な困難が予想されるため、縦列型のモデル構成についても検討を行う。
|
Expenditure Plans for the Next FY Research Funding |
当初は、音楽音響信号に対する確率モデルの学習のため、平成23年度中に高性能の計算機を購入予定であった。しかし、東日本大震災による電力使用制限のために計画を変更し、比較的計算量が小さい楽譜に対する確率モデルの学習に先に着手した。新型CPUの搭載により計算機の能力が大幅に向上することもあり、計算機の購入は平成24年度に繰り越すことにした。
|
Research Products
(5 results)