• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

信号処理と記号処理の確率的協働による音楽知能の創発

研究課題

研究課題/領域番号 26700020
研究機関京都大学

研究代表者

吉井 和佳  京都大学, 情報学研究科, 講師 (20510001)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワードノンパラメトリックベイズ / 機械学習 / 音楽情報処理
研究実績の概要

音楽音響信号を楽譜に変換するための取り組みとして、音響モデルと言語モデルの両面で当初の想定以上の進展があった。まず、音響モデルに関して、無限個のソースと無限個のフィルタからなる複合自己回帰モデル(ソース・フィルタ型NMF)を、人間の聴覚特性に合致する対数周波数軸上で再定式化することに成功した。これにより、自動採譜結果が10%以上向上し、競合する最新手法と同等レベルの性能を達成することができた。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIR 2015に採択された。また、NMF自体の改良として、尤度関数を複素ガウス分布ではなく、複素t分布に置き換えることにより、初期値依存性が低く、頑健な音源分離を行う手法を開発した。本研究成果は、信号処理分野のトップカンファレンスであるICASSP 2016に採択された。一方、音楽音響信号に対するコード認識に関しても、クロマベクトル特徴量の抽出の前に、あらかじめ歌声・伴奏音・打楽器音に分離しておく方式を考案した。識別器に関しても、通常のHMMではなく、コード遷移にビート位置依存性を考慮し、出力分布にvon MisesーFisher混合分布を用いることにより、大幅な性能向上を達成した。言語モデルに関しては、計算機上で音楽理論を扱うために標準的であったGenerative Theory of Tonal Music (GTTM)を確率的生成モデルの見地からとらえ直すことで、メロディ(一次元の音符系列)に対する確率的文脈自由文法 (PCFG)を定式化することに成功した。従来のGTTMでは、導出規則を人出でチューニングしていたのに対し、提案モデルでは自動的に推論されるにもかかわらず、従来より優れた構文解析精度を達成した。本研究成果も、ICASSP 2016に採択された。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

「研究実績の概要」に述べた通り、音響モデル・言語モデルの両側面で大幅な進展が見られたため、NMF, HMM, PCFGなどを統合するうえでの基盤ができあがった。

今後の研究の推進方策

当初の計画通り、音響モデルと言語モデルを統合することにより、音楽音響信号から自動採譜を行うと同時に、コード進行を学習する方式の考案に取り組む。さらに、複旋律音楽に対する音符配置モデルの定式化にも取り組む。

次年度使用額が生じた理由

楽譜に対す記号処理に関する研究推進のため、ポスドクを1名半年程度雇用することを急遽決定したので、人件費・謝金が当初の予定より増加した。一方、研究環境的な側面では、現有の機材で十分に対応可能であったので、高額な計算サーバなどの購入は見送ることとなった。

次年度使用額の使用計画

本年度はいよいよ大規模なデータ解析を行うステージに移行するため、CPUやGPUの世代交代のタイミングに合わせて、高速な計算サーバの購入を検討する。

  • 研究成果

    (12件)

すべて 2016 2015

すべて 学会発表 (12件) (うち国際学会 8件)

  • [学会発表] Student's t Nonnegative Matrix Factorization and Positive Semidefinite Tensor Factorization for Single-Channel Audio Source Separation2016

    • 著者名/発表者名
      Kazuyoshi Yoshii, Katsutoshi Itoyama, Masataka Goto
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 発表場所
      Shanghai, China
    • 年月日
      2016-03-20 – 2016-03-25
    • 国際学会
  • [学会発表] Tree-Structured Probabilistic Model of Monophonic Written Music Based on the Generative Theory of Tonal Music2016

    • 著者名/発表者名
      Eita Nakamura, Masatoshi Hamanaka, Keiji Hirata, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 発表場所
      Shanghai, China
    • 年月日
      2016-03-20 – 2016-03-25
    • 国際学会
  • [学会発表] 音楽音響信号解析のためのステューデントt分布に基づく非負値行列分解と半正定値テンソル分解2015

    • 著者名/発表者名
      吉井和佳, 糸山克寿, 後藤真孝
    • 学会等名
      電子情報通信学会 第18回情報論的学習理論ワークショップ
    • 発表場所
      つくば国際会議場
    • 年月日
      2015-11-25 – 2015-11-28
  • [学会発表] Infinite Superimposed Discrete All-pole Modeling for Source-Filter Decomposition of Wavelet Spectrograms2015

    • 著者名/発表者名
      Kazuyoshi Yoshii, Katsutoshi Itoyama, Masataka Goto
    • 学会等名
      International Society for Music Information Retrieval Conference (ISMIR)
    • 発表場所
      Malaga, Spain
    • 年月日
      2015-10-26 – 2015-10-30
    • 国際学会
  • [学会発表] Audio-Visual Beat Tracking based on a State-Space Model for a Music Robot Dancing with Humans2015

    • 著者名/発表者名
      Misato Ohkita, Yoshiaki Bando, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • 学会等名
      EEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
    • 発表場所
      Hamburg, Germany
    • 年月日
      2015-09-28 – 2015-10-02
    • 国際学会
  • [学会発表] 非ガウス性モノラル音響信号に対する音源分離のための非負値行列分解と半正定値テンソル分解2015

    • 著者名/発表者名
      吉井和佳, 糸山克寿, 後藤真孝
    • 学会等名
      情報処理学会 第108回音楽情報科学研究会
    • 発表場所
      名古屋大学
    • 年月日
      2015-08-31 – 2015-09-01
  • [学会発表] 音楽音響信号に対する歌声・伴奏音・打楽器音分離に基づくコード認識2015

    • 著者名/発表者名
      丸尾智志, 池宮由楽, 糸山克寿, 吉井和佳
    • 学会等名
      情報処理学会 第108回音楽情報科学研究会
    • 発表場所
      名古屋大学
    • 年月日
      2015-08-31 – 2015-09-01
  • [学会発表] A Music Performance Assistance System based on Vocal, Harmonic, and Percussive Source Separation and Content Visualization for Music Audio Signals2015

    • 著者名/発表者名
      Ayaka Dobashi, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • 学会等名
      Sound and Music Computing Conference (SMC)
    • 発表場所
      Maynooth, Ireland
    • 年月日
      2015-07-26 – 2015-08-01
    • 国際学会
  • [学会発表] A Score-Informed Piano Tutoring System with Mistake Detection and Score Simplification2015

    • 著者名/発表者名
      Tsubasa Fukuda, Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • 学会等名
      Sound and Music Computing Conference (SMC)
    • 発表場所
      Maynooth, Ireland
    • 年月日
      2015-07-26 – 2015-08-01
    • 国際学会
  • [学会発表] モノラル音楽音響信号を対象としたRPCAと音高推定に基づく歌声・伴奏分離2015

    • 著者名/発表者名
      池宮由楽, 糸山克寿, 吉井和佳
    • 学会等名
      情報処理学会 第107回音楽情報科学研究会
    • 発表場所
      電気通信大学
    • 年月日
      2015-05-23 – 2015-05-24
  • [学会発表] Singing Voice Analysis and Editing based on Mutually Dependent F0 Estimation and Source Separation2015

    • 著者名/発表者名
      Yukara Ikemiya, Kazuyoshi Yoshii, Katsutoshi Itoyama
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-05-19 – 2015-05-24
    • 国際学会
  • [学会発表] A Feedback Framework for Improved Chord Recognition Based on NMF-based Approximate Note Transcription2015

    • 著者名/発表者名
      Satoshi Maruo, Kazuyoshi Yoshii, Katsutoshi Itoyama, Matthias Mauch, Masataka Goto
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-05-19 – 2015-05-24
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi