2011 Fiscal Year Research-status Report

ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離

Research Project

Project/Area Number	23700184
Research Institution	National Institute of Advanced Industrial Science and Technology
Principal Investigator	吉井和佳独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (20510001)
Project Period (FY)	2011-04-28 – 2013-03-31
Keywords	音楽情報処理 / 機械学習 / ノンパラメトリックベイズ
Research Abstract	本研究の目的は、音楽音響信号データに対して音源分離と構造学習を同時的に行うための統一的なノンパラメトリックベイズモデルの提案である。平成23年度は主に、「楽譜データに対する構造学習」に関する研究を行った。具体的には、C majorやD minorなどといったコードラベルが付与されていない和音（複数の音符の同時発音）の系列を確率モデルで表現することに取り組んだ。従来、この種の問題においては、隣り合う和音には依存関係があることからn-gramモデルを利用するのが一般的であり、nの値を固定し、語彙として和音の種類（コードラベル）は事前に定めるものとされていた。しかし、現実には様々な長さの典型的なコードパターンが存在し、日々新しいコードが確立されていることを考えると、そのような仮定は適切ではない。本研究では、ノンパラメトリックベイズモデルを用いて、nの値を系列中の各和音ごとに可変とし、無限種類の和音を扱うことを可能にした。実験の結果、後続の和音の予測精度が向上することを確認した。これは、人間が音楽的なセンスを経験的に獲得するのと同様に、教師なしで音楽の構造を理解する計算機を構築する上で、非常に重要な成果である。本研究成果は、それぞれ音楽情報処理分野および信号処理のトップカンファレンスであるISMIRおよびICASSPにて登壇発表を行った（後者は特別セッションにおける招待講演）。さらに、機械学習分野のトップカンファレンスであるNIPS併設のワークショップMMLにおいても登壇発表を行った。一方、「音響データに対する音源分離」に関する検討もすでに開始している。具体的には、自らのこれまでの研究成果である、音響信号中に無限個の音源が含まれていることを理論上許容する無限潜在的調波配分法をヒントに、より高精度かつ学習の際の初期値依存性が低いモデルを構築することができる見込みである。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 研究計画書には、平成23年度は「音響データに対する音源分離」と「楽譜データに対する構造学習」を行うと記載されている。研究実績の概要に記述した通り、おおむね目標を達成できている。研究成果は著名な国際会議にて発表することができており、成果の発信の点においても順調である。
Strategy for Future Research Activity	平成24年度は、音楽音響信号データおよび楽譜データに対する確率モデルを洗練化すると同時に、その統合についても検討を進める。両者のモデルを同時的に学習するうえでは様々な困難が予想されるため、縦列型のモデル構成についても検討を行う。
Expenditure Plans for the Next FY Research Funding	当初は、音楽音響信号に対する確率モデルの学習のため、平成23年度中に高性能の計算機を購入予定であった。しかし、東日本大震災による電力使用制限のために計画を変更し、比較的計算量が小さい楽譜に対する確率モデルの学習に先に着手した。新型CPUの搭載により計算機の能力が大幅に向上することもあり、計算機の購入は平成24年度に繰り越すことにした。

Research Products
(5 results)

All 2012 2011 Other

All Presentation (4 results) Remarks (1 results)

[Presentation] Unsupervised Music Understanding Based on Nonparametric Bayesian Models2012
- Author(s)
  Kazuyoshi Yoshii, Masataka Goto
- Organizer
  The 37th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)(招待講演)
- Place of Presentation
  京都国際会館（京都府）
- Year and Date
  2012 – 329
[Presentation] 和音進行解析のための語彙フリー無限グラムモデル2011
- Author(s)
  吉井和佳，後藤真孝
- Organizer
  情報処理学会第91回音楽情報科学研究会
- Place of Presentation
  関西学院大学（兵庫県）
- Year and Date
  2011 – 727
[Presentation] A Unified Probabilistic Model of Note Combinations and Chord Progressions2011
- Author(s)
  Kazuyoshi Yoshii, Matthias Mauch Masataka Goto
- Organizer
  A Unified Probabilistic Model of Note Combinations and Chord Progressions
- Place of Presentation
  グラナダ（スペイン）
- Year and Date
  2011 – 1217
[Presentation] A Vocabulary-Free Infinity-Gram Model for Nonparametric Bayesian Chord Progression Analysis2011
- Author(s)
  Kazuyoshi Yoshii, Masataka Goto
- Organizer
  The 12th International Society for Music Information Retrieval Conference (ISMIR)
- Place of Presentation
  マイアミ（米国）
- Year and Date
  2011 – 1027
[Remarks]
- URL
  http://staff.aist.go.jp/k.yoshii/

2011 Fiscal Year Research-status Report

ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離

Principal Investigator

吉井 和佳 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (20510001)

Current Status of Research Progress

Reason

Research Products

[Presentation] Unsupervised Music Understanding Based on Nonparametric Bayesian Models2012

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 和音進行解析のための語彙フリー無限グラムモデル2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] A Unified Probabilistic Model of Note Combinations and Chord Progressions2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] A Vocabulary-Free Infinity-Gram Model for Nonparametric Bayesian Chord Progression Analysis2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

吉井和佳独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (20510001)