• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

認識・生成過程の統合に基づく視聴覚音楽理解

研究課題

研究課題/領域番号 19H04137
研究機関京都大学

研究代表者

吉井 和佳  京都大学, 情報学研究科, 准教授 (20510001)

研究分担者 河原 達也  京都大学, 情報学研究科, 教授 (00234104)
森島 繁生  早稲田大学, 理工学術院, 教授 (10200411)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード音楽情報処理 / 深層学習 / ベイズ学習 / 信号処理 / 記号処理 / 音響信号処理 / 音声処理 / 画像処理
研究実績の概要

2021年度は、音楽認識に関して、これまで培った各種技術の統合と高度化に取り組むとともに、音楽生成に関して、自動編曲技術の開発にも着手した。まず、相互依存関係を持つコードとキーの同時推定に関して、コード推論モデルとクロマベクトル生成モデルの同時学習を行うための変分自己符号化器 (VAE) を拡張し、キー系列・コード系列・クロマベクトル系列の三階層からなる階層VAEを定式化することで、キー推論モデルとコード生成モデルの同時学習を実現した。また、拍節構造推定に関して、各フレームにおけるビート・ダウンビートの存在確率 (0から1) を予測する代わりに、位相 (0から2pi) を予測することで、拍節構造の周期性を効果的に学習する手法を考案した。さらに、ドラム採譜に関して、大域的な周期構造を捉えるため、周期関数に基づく位置エンコーディングと自己注意機構に加えて、ドラム言語モデルに基づく正則化を用いる手法を考案した。ピアノ採譜に関しては、採譜誤りは挿入・削除・置換からなる確率的な編集操作であるという立場から、誤りを含む採譜結果の生成過程を階層隠れマルコフモデル (HHMM) を用いて定式化し、誤りを含む採譜結果から真の楽譜を解析的に推定する手法を考案した。また、ピアノ採譜における音価・声部推定部において、従来のHMMの代わりに、深層学習を用いて一挙に推論を行う手法を考案した。一方で、自動編曲に関して、ポピュラー音楽のバンド譜からピアノ譜への深層変換モデルを学習する際に、本来一意に定めることができない正解楽譜と音符レベルで表層的に一致させるだけではなく、音符全体から計算される統計量(同時発音数・音高幅・音符密度)を、所望の難易度の統計量に近づくような正則化を行う手法を考案した。視覚情報の取り扱いに関して、VAEに基づく画像データに対する姿勢推定技術の高精度化も実現した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

「研究実績の概要」に述べた通り、当初の目標である聴覚系・視覚系における音楽理解に向けて着実に進んでいる。音楽解析・創作の両面において顕著な進展が見られた。

今後の研究の推進方策

音楽認識に関して、様々な音楽要素を同時に推定可能な統合技術の開発に取り組む。ポピュラー音楽の骨格をなす歌声解析に関しては、歌声採譜・音源分離・歌詞認識などの技術の統合に取り組む。音楽創作に関して、自動編曲における連続的な難易度制御や、自動伴奏システムの開発にも取り組む。

  • 研究成果

    (10件)

すべて 2021

すべて 雑誌論文 (5件) (うち査読あり 5件) 学会発表 (5件) (うち国際学会 5件)

  • [雑誌論文] Global Structure-Aware Drum Transcription Based on Self-Attention Mechanisms2021

    • 著者名/発表者名
      Ryoto Ishizuka, Ryo Nishikimi, Kazuyoshi Yoshii
    • 雑誌名

      Signals

      巻: 2 ページ: 508-526

    • DOI

      10.3390/signals2030031

    • 査読あり
  • [雑誌論文] MirrorNet: A Deep Reflective Approach to 2D Pose Estimation for Single-Person Images2021

    • 著者名/発表者名
      Takayuki Nakatsuka, Kazuyoshi Yoshii, Yuki Koyama, Satoru Fukayama, Masataka Goto, Shigeo Morishima
    • 雑誌名

      Journal of Information Processing

      巻: 29 ページ: 406-423

    • DOI

      10.2197/ipsjjip.29.406

    • 査読あり
  • [雑誌論文] Musical Rhythm Transcription Based on Bayesian Piece-Specific Score Models Capturing Repetitions2021

    • 著者名/発表者名
      Eita Nakamura, Kazuyoshi Yoshii
    • 雑誌名

      Information Sciences

      巻: 572 ページ: 482-500

    • DOI

      10.1016/j.ins.2021.04.100

    • 査読あり
  • [雑誌論文] Audio-to-Score Singing Transcription Based on a CRNN-HSMM Hybrid Model2021

    • 著者名/発表者名
      Ryo Nishikimi, Eita Nakamura, Masataka Goto, Kazuyoshi Yoshii
    • 雑誌名

      APSIPA Transactions on Signal and Information Processing

      巻: 10 ページ: 1-13

    • DOI

      10.1017/atsip.2021.4

    • 査読あり
  • [雑誌論文] Non-local Musical Statistics as Guides for Audio-to-Score Piano Transcription2021

    • 著者名/発表者名
      Kentaro Shibata, Eita Nakamura, Kazuyoshi Yoshii
    • 雑誌名

      Information Sciences

      巻: 566 ページ: 262-280

    • DOI

      10.1016/j.ins.2021.03.014

    • 査読あり
  • [学会発表] Joint Estimation of Note Values and Voices for Audio-to-Score Piano Transcription2021

    • 著者名/発表者名
      Yuki Hiramatsu, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      International Society for Music Information Retrieval Conference (ISMIR)
    • 国際学会
  • [学会発表] Phase-Aware Joint Beat and Downbeat Estimation Based on Periodicity of Metrical Structure2021

    • 著者名/発表者名
      Takehisa Oyama, Ryoto Ishizuka, Kazuyoshi Yoshii
    • 学会等名
      International Society for Music Information Retrieval Conference (ISMIR)
    • 国際学会
  • [学会発表] Statistical Correction of Transcribed Melody Notes Based on Probabilistic Integration of a Music Language Model and a Transcription Error Model2021

    • 著者名/発表者名
      Yuki Hiramatsu, Go Shibata, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 国際学会
  • [学会発表] Pitch-Timbre Disentanglement of Musical Instrument Sounds Based on VEA-Based Metric Learning2021

    • 著者名/発表者名
      Keitaro Tanaka, Ryo Nishikimi, Yoshiaki Bando, Kazuyoshi Yoshii, Shigeo Morishima
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 国際学会
  • [学会発表] A Real-Time Drum-Wise Volume Visualization System for Learning Volume-Balanced Drum Performance2021

    • 著者名/発表者名
      Mitsuki Hosoya, Masanori Morise, Satoshi Nakamura, Kazuyoshi Yoshii
    • 学会等名
      International Conference on Entertainment Computing (ICEC)
    • 国際学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi