• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

深層ベイズ学習に基づく歌声の認識と生成の統一理論

研究課題

研究課題/領域番号 19J15255
研究種目

特別研究員奨励費

配分区分補助金
応募区分国内
審査区分 小区分61030:知能情報学関連
研究機関京都大学

研究代表者

錦見 亮  京都大学, 情報学研究科, 特別研究員(DC2)

研究期間 (年度) 2019-04-25 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
2,100千円 (直接経費: 2,100千円)
2020年度: 1,000千円 (直接経費: 1,000千円)
2019年度: 1,100千円 (直接経費: 1,100千円)
キーワード音楽情報処理 / 自動採譜 / 歌声採譜
研究開始時の研究の概要

本研究では,人間が自身の個性を反映しながら「音楽を生成する過程」と「音楽を認識する過程」を統一的に記述するモデルを構成することで,表裏一体の関係にある音楽情報処理の認識タスク(個性を反映した歌声や楽曲の自動生成やスタイル変換)と生成タスク(音源分離や自動採譜,個性や歌唱表現の解析)とを双方の依存関係を考慮しながら同時に解決できる方法論を確立する.

研究実績の概要

本研究では,音楽音響信号から歌声が担う主旋律の楽譜を推定する歌声採譜技術を扱う.主旋律は多くの楽曲の印象に密接に関連しているため,歌声採譜は認識・生成の双方向歌声解析において重要な技術である.歌声の音高軌跡(F0軌跡)はビブラートやオーバシュート等の歌唱表現よって,楽譜に記述された音符の音高や発音時刻から大きく逸脱しているため,単純な方法では音楽的に不自然な音符列が推定されてしまう.また,従来法は事前推定したF0軌跡を時間・周波数方向に離散化して楽譜を推定しているが,事前推定による誤差伝播の問題や音符のオンセット情報が欠落したF0軌跡からは同音高の連続音符の境界が判定不能という問題があるため,音楽音響信号を直接扱える手法の構築が必要であった.
そこで本研究では,深層ニューラルネットワークに基づく音響モデルと従来の統計モデルに基づく言語モデルを統合した音楽音響信号の生成モデルを開発した.提案モデルにおいて,言語モデルはセミマルコフモデル(semi-Markov model; SMM)で構成され,調に依存しながら音符系列が生成される過程を表現する.また,音響モデルは畳み込みリカレントニューラルネットワーク(convolutional recurrent neural network; CRNN)で構成され,音符に基づいて観測音楽音響信号が生成される過程を表現する.提案モデルは,言語モデルに基づく音符に関する文法的な知識とCRNN音響モデルの表現力の両方を活用しながら,ビタビアルゴリズムを用いて音楽信号から直接音符を推定する.実際の音楽音響信号と合成の歌声を用いた評価実験では,従来の歌声F0軌跡に対する歌声採譜手法よりも高い性能を達成した.また,音響モデルのみ用いて推定された楽譜よりも高い性能を達成したことから,言語モデルと音響モデルを統合することの有効性も確認した.

現在までの達成度 (段落)

令和2年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和2年度が最終年度であるため、記入しない。

報告書

(2件)
  • 2020 実績報告書
  • 2019 実績報告書
  • 研究成果

    (28件)

すべて 2021 2020 2019

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 1件) 学会発表 (25件) (うち国際学会 12件)

  • [雑誌論文] Audio-to-Score Singing Transcription Based on a CRNN-HSMM Hybrid Model2021

    • 著者名/発表者名
      Ryo Nishikimi, Eita Nakamura, Masataka Goto, Kazuyoshi Yoshii
    • 雑誌名

      APSIPA Transactions on Signal and Information Processing

      巻: 10 号: 1 ページ: 1-13

    • DOI

      10.1017/atsip.2021.4

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 同質性・反復性・規則性を考慮した階層隠れセミマルコフモデルに基づく統計的音楽構造解析2020

    • 著者名/発表者名
      柴田 剛, 錦見 亮, 中村 栄太, 吉井 和佳
    • 雑誌名

      情報処理学会論文誌

      巻: 61 号: 4 ページ: 757-767

    • DOI

      10.20729/00204224

    • NAID

      170000181816

    • 年月日
      2020-04-15
    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Bayesian Singing Transcription Based on a Hierarchical Generative Model of Keys, Musical Notes, and F0 Trajectories2020

    • 著者名/発表者名
      Nishikimi Ryo、Nakamura Eita、Goto Masataka、Itoyama Katsutoshi、Yoshii Kazuyoshi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 28 ページ: 1678-1691

    • DOI

      10.1109/taslp.2020.2996095

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [学会発表] Pitch-Timbre Disentanglement of Musical Instrument Sounds Based on VAE-Based Metric Learning2021

    • 著者名/発表者名
      Keitaro Tanaka, Ryo Nishikimi, Yoshiaki Bando, Kazuyoshi Yoshii, Shigeo Morishima
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Statistical Correction of Transcribed Melody Notes Based on Probabilistic Integration of a Music Language Model and a Transcription Error Model2021

    • 著者名/発表者名
      Yuki Hiramatsu, Go Shibata, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] ピアノ採譜のための深層学習に基づく音価と声部の同時推定2021

    • 著者名/発表者名
      平松 祐紀, 柴田 剛, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第83回全国大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 拍節構造の周期性に基づく深層ビート推定2021

    • 著者名/発表者名
      大山偉永, 石塚 崚斗, 錦見 亮, 吉井 和佳
    • 学会等名
      情報処理学会 第83回全国大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] ポピュラー音楽に対する難易度に応じた深層ピアノ編曲2021

    • 著者名/発表者名
      寺尾萌夢, 石塚 崚斗, 錦見 亮, 吉井 和佳
    • 学会等名
      情報処理学会 第83回全国大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] Tatum-Level Drum Transcription Based on a Convolutional Recurrent Neural Network with Language Mdoel-Based Regularized Training2020

    • 著者名/発表者名
      Ryoto Ishizuka, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      2020 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Music Structure Analysis Based on an LSTM-HSMM Hybrid Model2020

    • 著者名/発表者名
      Go Shibata, Ryo Nishikimi, Kazuyoshi Yoshii
    • 学会等名
      The 21th Annual Conference of the International Society for Music Information Retrieval
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] Multi-Instrument Music Transcription Based on Deep Spherical Clustering of Spectrograms and Pitchgrams2020

    • 著者名/発表者名
      Keitaro Tanaka, Takayuki Nakatsuka, Ryo Nishikimi, Kazuyoshi Yoshii, Shigeo Morishima
    • 学会等名
      The 21th Annual Conference of the International Society for Music Information Retrieval
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [学会発表] 大局的構造に基づく正則化を用いた自己注意機構付き深層ドラム採譜2020

    • 著者名/発表者名
      石塚 崚斗, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第129回音楽情報科学研究会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 事前学習済み言語モデルによる正則化を用いた深層ドラム採譜2020

    • 著者名/発表者名
      石塚 崚斗, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第128回音楽情報科学研究会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] LSTM-HSMMハイブリッドモデルに基づく音楽構造解析2020

    • 著者名/発表者名
      柴田 剛, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第128回音楽情報科学研究会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] スペクトログラムとピッチグラムの深層クラスタリングに基づく複数楽器パート採譜2020

    • 著者名/発表者名
      田中 啓太郎, 中塚 貴之, 錦見 亮, 吉井 和佳, 森島 繁生
    • 学会等名
      情報処理学会 第128回音楽情報科学研究会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 階層隠れセミマルコフモデルと深層学習に基づく楽曲セクションの境界推定とラベル付け2020

    • 著者名/発表者名
      柴田 剛, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第82回全国大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 深層クラスタリングを用いた任意楽器パートの自動採譜2020

    • 著者名/発表者名
      田中 啓太郎, 中塚 貴之, 錦見 亮, 吉井 和佳, 森島 繁生
    • 学会等名
      情報処理学会 第82回全国大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 深層音響・言語モデルの統合に基づくドラム採譜2020

    • 著者名/発表者名
      石塚 崚斗, 上田 瞬, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第82回全国大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] End-to-End Melody Note Transcription Based on a Beat-Synchronous Attention Mechanism2019

    • 著者名/発表者名
      Ryo Nishikimi, Eita Nakamura, Masataka Goto, Kazuyoshi Yoshii
    • 学会等名
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Automatic Singing Transcription Based on Encoder-Decoder Recurrent Neural Networks with a Weakly-Supervised Attention Mechanism2019

    • 著者名/発表者名
      Ryo Nishikimi, Eita Nakamura, Satoru Fukayama, Masataka Goto, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] ビート同期注意機構に基づく歌声のリズム採譜2019

    • 著者名/発表者名
      錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第124回音楽情報科学研究会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Joint Singing Pitch Estimation and Voice Separation Based on Neural Harmonic Structure Renderer2019

    • 著者名/発表者名
      Tomoyasu Nakano, Kazuyoshi Yoshii, Yiming Wu, Ryo Nishikimi, Kin Wah Edward Lin, Masataka Goto
    • 学会等名
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Statistical Music Structure Analysis Based on a Homogeneity-, and Repetitiveness-, and Regularity-Aware Hierarchical Hidden Semi-Markov Model2019

    • 著者名/発表者名
      Go Shibata, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      The 20th Annual Conference of the International Society for Music Information Retrieval
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Unsupervised Melody Style Conversion2019

    • 著者名/発表者名
      Eita Nakamura, Kentaro Shibata, Ryo Nishikimi, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Joint Transcription of Lead, Bass, and Rhythm Guitars Based on a Factorial Hidden Semi-Markov Model2019

    • 著者名/発表者名
      Kentaro Shibata, Ryo Nishikimi, Satoru Fukayama, Masataka Goto, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Bayesian Drum Transcription Based on Noonegative Matrix Factor Decomposition with a Deep Score Prior2019

    • 著者名/発表者名
      Shun Ueda, Kentaro Shibata, Yusuke Wada, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] 音楽言語モデルと採譜誤りモデルに基づく歌声採譜結果の訂正2019

    • 著者名/発表者名
      平松 祐紀, 柴田 剛, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第82回全国大会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] 深層ドラム譜事前分布に基づく畳み込み非負値行列因子分解を用いたドラム採譜2019

    • 著者名/発表者名
      上田 瞬, 柴田 健太郎, 和田 雄介, 錦見 亮, 中村 栄太, 吉井 和佳
    • 学会等名
      情報処理学会 第122回音楽情報科学研究会
    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2019-05-29   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi