• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離

Research Project

Project/Area Number 23700184
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

吉井 和佳  独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (20510001)

Project Period (FY) 2011-04-28 – 2013-03-31
Keywords音楽情報処理 / 機械学習 / ノンパラメトリックベイズ
Research Abstract

本研究の目的は、音楽音響信号データに対して音源分離と構造学習を同時的に行うための統一的なノンパラメトリックベイズモデルの提案である。平成23年度は主に、「楽譜データに対する構造学習」に関する研究を行った。具体的には、C majorやD minorなどといったコードラベルが付与されていない和音(複数の音符の同時発音)の系列を確率モデルで表現することに取り組んだ。従来、この種の問題においては、隣り合う和音には依存関係があることからn-gramモデルを利用するのが一般的であり、nの値を固定し、語彙として和音の種類(コードラベル)は事前に定めるものとされていた。しかし、現実には様々な長さの典型的なコードパターンが存在し、日々新しいコードが確立されていることを考えると、そのような仮定は適切ではない。本研究では、ノンパラメトリックベイズモデルを用いて、nの値を系列中の各和音ごとに可変とし、無限種類の和音を扱うことを可能にした。実験の結果、後続の和音の予測精度が向上することを確認した。これは、人間が音楽的なセンスを経験的に獲得するのと同様に、教師なしで音楽の構造を理解する計算機を構築する上で、非常に重要な成果である。本研究成果は、それぞれ音楽情報処理分野および信号処理のトップカンファレンスであるISMIRおよびICASSPにて登壇発表を行った(後者は特別セッションにおける招待講演)。さらに、機械学習分野のトップカンファレンスであるNIPS併設のワークショップMMLにおいても登壇発表を行った。一方、「音響データに対する音源分離」に関する検討もすでに開始している。具体的には、自らのこれまでの研究成果である、音響信号中に無限個の音源が含まれていることを理論上許容する無限潜在的調波配分法をヒントに、より高精度かつ学習の際の初期値依存性が低いモデルを構築することができる見込みである。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画書には、平成23年度は「音響データに対する音源分離」と「楽譜データに対する構造学習」を行うと記載されている。研究実績の概要に記述した通り、おおむね目標を達成できている。研究成果は著名な国際会議にて発表することができており、成果の発信の点においても順調である。

Strategy for Future Research Activity

平成24年度は、音楽音響信号データおよび楽譜データに対する確率モデルを洗練化すると同時に、その統合についても検討を進める。両者のモデルを同時的に学習するうえでは様々な困難が予想されるため、縦列型のモデル構成についても検討を行う。

Expenditure Plans for the Next FY Research Funding

当初は、音楽音響信号に対する確率モデルの学習のため、平成23年度中に高性能の計算機を購入予定であった。しかし、東日本大震災による電力使用制限のために計画を変更し、比較的計算量が小さい楽譜に対する確率モデルの学習に先に着手した。新型CPUの搭載により計算機の能力が大幅に向上することもあり、計算機の購入は平成24年度に繰り越すことにした。

  • Research Products

    (5 results)

All 2012 2011 Other

All Presentation (4 results) Remarks (1 results)

  • [Presentation] Unsupervised Music Understanding Based on Nonparametric Bayesian Models2012

    • Author(s)
      Kazuyoshi Yoshii, Masataka Goto
    • Organizer
      The 37th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)(招待講演)
    • Place of Presentation
      京都国際会館(京都府)
    • Year and Date
      2012 – 329
  • [Presentation] 和音進行解析のための語彙フリー無限グラムモデル2011

    • Author(s)
      吉井和佳,後藤真孝
    • Organizer
      情報処理学会 第91回音楽情報科学研究会
    • Place of Presentation
      関西学院大学(兵庫県)
    • Year and Date
      2011 – 727
  • [Presentation] A Unified Probabilistic Model of Note Combinations and Chord Progressions2011

    • Author(s)
      Kazuyoshi Yoshii, Matthias Mauch Masataka Goto
    • Organizer
      A Unified Probabilistic Model of Note Combinations and Chord Progressions
    • Place of Presentation
      グラナダ(スペイン)
    • Year and Date
      2011 – 1217
  • [Presentation] A Vocabulary-Free Infinity-Gram Model for Nonparametric Bayesian Chord Progression Analysis2011

    • Author(s)
      Kazuyoshi Yoshii, Masataka Goto
    • Organizer
      The 12th International Society for Music Information Retrieval Conference (ISMIR)
    • Place of Presentation
      マイアミ(米国)
    • Year and Date
      2011 – 1027
  • [Remarks]

    • URL

      http://staff.aist.go.jp/k.yoshii/

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi