• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

ノンパラメトリックベイズ理論に基づく音楽音響信号の構造学習と音源分離

Research Project

Project/Area Number 23700184
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

吉井 和佳  独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (20510001)

Keywords音楽情報処理 / 機械学習 / ノンパラメトリックベイズ
Research Abstract

本研究の目的は、音楽音響信号データに対して音源分離と構造学習を同時的に行うための統一的なノンパラメトリックベイズモデルの提案である。平成24年度は主に、「音響データに対する音源分離」に関する技術開発を行った。具体的には、市販CDのように様々な音色および音高から構成される混合音を楽器パート(音色)ごとに分離するための確率モデルについての研究を行った。従来、混合音の音源分離のための標準的な方法である非負値行列分解 (NMF) では、混合音を音高ごとに分離することができても、音色ごとに分離することはできなかった。そのため、分離された楽器音を音色ごとにクラスタリングする処理が別途必要であった。本研究では、ソース・フィルタ理論に基づいて、混合音中に含まれる楽器音の音色と音高とを一挙に推定することを可能にした。このとき、音色と音高の個数は未知であるため、理論上可算無限個の音色と音高とが存在することを許容するノンパラメトリックベイズモデルを提案した。実験の結果、改善の余地はあるものの、ポピュラー音楽の音響信号をベース・ボーカル・ギター・ドラムなどの楽器パートに分離できることを確認した。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIRにて発表を行った。このアイデアをさらに発展させることで、無限カーネル線形予測分析や無限半正定値テンソル分解とよぶ音響信号解析のための新しい確率モデルを提案することができた。これらの研究成果はそれぞれ、信号処理分野および機械学習分野のトップカンファレンスであるICASSPおよびICMLにて採択されている。このように、平成24年度には音響信号の解析について予想以上の進展が見られた。さらに、平成23年度に開発した「楽譜データに対する構造学習」に関する技術を確率的な枠組みのもとで統合する方法について予備的な実験を行うまで研究を進めることができた。

  • Research Products

    (7 results)

All Other

All Presentation (6 results) Remarks (1 results)

  • [Presentation] Infinite Composite Autoregressive Models for Music Signal Analysis

    • Author(s)
      Kazuyoshi Yoshii and Masataka Goto
    • Organizer
      The 13th International Society for Music Information Retrieval Conference (ISMIR)
    • Place of Presentation
      ポルト(ポルトガル)
  • [Presentation] Infinite Kernel Linear Prediction for Joint Estimation of Spectral Envelope and Fundamental Frequency

    • Author(s)
      Kazuyoshi Yoshii and Masataka Goto
    • Organizer
      The 38th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Place of Presentation
      バンクーバー(カナダ)
  • [Presentation] Infinite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals

    • Author(s)
      Kazuyoshi Yoshii, Ryota Tomioka, Daichi Mochihashi, and Masataka Goto
    • Organizer
      The 30th International Conference on Machine Learning (ICML)
    • Place of Presentation
      アトランタ(米国)
  • [Presentation] 多重音基本周波数解析のための無限複合自己回帰モデル

    • Author(s)
      吉井和佳, 後藤真孝
    • Organizer
      情報処理学会 第96回音楽情報科学研究会
    • Place of Presentation
      近江町交流プラザ(金沢市)
  • [Presentation] 音楽音響信号解析のためのガンマ過程に基づく無限複合自己回帰モデル

    • Author(s)
      吉井和佳, 後藤真孝
    • Organizer
      第15回情報論的学習理論ワークショップ
    • Place of Presentation
      筑波大学(東京都)
  • [Presentation] スペクトル包絡と基本周波数の同時推定のための無限カーネル線形予測分析法

    • Author(s)
      吉井和佳, 後藤真孝
    • Organizer
      情報処理学会 第99回音楽情報科学研究会
    • Place of Presentation
      お茶の水女子大学(東京都)
  • [Remarks] 吉井 和佳

    • URL

      http://staff.aist.go.jp/k.yoshii/

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi