• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

認識・生成過程の統合に基づく視聴覚音楽理解

研究課題

研究課題/領域番号 19H04137
研究機関京都大学

研究代表者

吉井 和佳  京都大学, 情報学研究科, 准教授 (20510001)

研究分担者 河原 達也  京都大学, 情報学研究科, 教授 (00234104)
森島 繁生  早稲田大学, 理工学術院, 教授 (10200411)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード音楽情報処理 / 深層学習 / 信号処理 / 記号処理
研究実績の概要

2022年度は、音楽理解の計算モデルを構築するという観点から、音楽データの認識技術と生成技術に関して多方面から取り組んだ。まず、音楽音響信号に対するEnd-to-End型歌声解析に関して、音高・発音時刻推定の結果を用いることで、CTCに基づく歌詞認識精度が向上することを実証した。音楽音響信号に対するEnd-to-End型歌声採譜に関して、各フレームの小節内相対位置および歌声の音高・発音時刻の有無を同時推定できるようにCTCに基づく学習を行うことにより、従来のようにMIDIデータではなく、直接楽譜を出力することを可能にした。また、拍節構造推定に関して、DNN-HMM型の音声認識に着想を得て、予め各フレームの小節内相対位置を推定するDNNを教師あり学習しておき、小節内相対位置(潜在変数)から特徴量系列(観測変数)が生成される過程を表現するDNN-HMMを構成することで、拍節構造の音楽的整合性を考慮した推定と、混合拍子への対応を実現した。さらに、End-to-End型ドラム採譜に関して、CTCにおけるアラインメント計算時に、テンポの一定性に関する制約を導入する新しい方式を考案した。一方、ポピュラー音楽のバンド譜からピアノ譜への自動編曲に関して、学習データには初級と上級のピアノ譜しか存在しないにも関わらず、出力される各音符の基本重要度を推定し、所望の難易度に合わせたワーピング処理を行うことで、任意の難易度を指定可能な編曲を行う手法を考案した。また、今後の研究の礎として、ピアノ譜から吹奏楽譜への自動編曲についても、深層学習技術の適用可能性に関する初期的な検討を行った。

現在までの達成度 (段落)

令和4年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和4年度が最終年度であるため、記入しない。

  • 研究成果

    (12件)

すべて 2022

すべて 雑誌論文 (3件) (うち国際共著 2件、 査読あり 3件、 オープンアクセス 2件) 学会発表 (9件) (うち国際学会 9件)

  • [雑誌論文] Joint Chord and Key Estimation Based on a Hierarchical Variational Autoencoder with Multi-task Learning2022

    • 著者名/発表者名
      Wu Yiming, Yoshii Kazuyoshi
    • 雑誌名

      APSIPA Transactions on Signal and Information Processing

      巻: 11 ページ: 1-27

    • DOI

      10.1561/116.00000052

    • 査読あり / オープンアクセス
  • [雑誌論文] Autoregressive Moving Average Jointly-Diagonalizable Spatial Covariance Analysis for Joint Source Separation and Dereverberation2022

    • 著者名/発表者名
      Sekiguchi Kouhei, Bando Yoshiaki, Nugraha Aditya Arie, Fontaine Mathieu, Yoshii Kazuyoshi, Kawahara Tatsuya
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 30 ページ: 2368-2382

    • DOI

      10.1109/TASLP.2022.3190734

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Generalized Fast Multichannel Nonnegative Matrix Factorization Based on Gaussian Scale Mixtures for Blind Source Separation2022

    • 著者名/発表者名
      Fontaine Mathieu, Sekiguchi Kouhei, Nugraha Aditya Arie, Bando Yoshiaki, Yoshii Kazuyoshi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 30 ページ: 1734-1748

    • DOI

      10.1109/TASLP.2022.3172631

    • 査読あり / 国際共著
  • [学会発表] End-to-End Lyrics Transcription Informed by Pitch and Onset Estimation2022

    • 著者名/発表者名
      Tengyu Deng, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      International Society for Music Information Retrieval Conference (ISMIR)
    • 国際学会
  • [学会発表] Tracking the Evolution of a Band's Performances over Decades2022

    • 著者名/発表者名
      Florian Thalmann, Eita Nakamura, Kazuyoshi Yoshii
    • 学会等名
      International Society for Music Information Retrieval Conference (ISMIR)
    • 国際学会
  • [学会発表] Difficulty-Aware Neural Band-to-Piano Score Arrangement Based on Note- and Statistic-Level Criteria2022

    • 著者名/発表者名
      Moyu Terao, Yuki Hiramatsu, Ryoto Ishizuka, Yiming Wu, and Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 国際学会
  • [学会発表] Direction-Aware Adaptive Online Neural Speech Enhancement with an Augmented Reality Headset in Real Noisy Conversational Environments2022

    • 著者名/発表者名
      Kouhei Sekiguchi, Aditya Arie Nugraha, Yicheng Du, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii
    • 学会等名
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)
    • 国際学会
  • [学会発表] Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments2022

    • 著者名/発表者名
      Yicheng Du, Aditya Arie Nugraha, Kouhei Sekiguchi, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii
    • 学会等名
      Annual Conference of the International Speech Communication Association (Interspeech)
    • 国際学会
  • [学会発表] DNN-Free Low-Latency Adaptive Speech Enhancement Based on Frame-Online Beamforming Powered by Block-Online FastMNMF2022

    • 著者名/発表者名
      Aditya Arie Nugraha, Kouhei Sekiguchi, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Workshop on Acoustic Signal Enhancement (IWAENC)
    • 国際学会
  • [学会発表] Localization and Synchronization of Distributed Camera-Attached Microphone Arrays for Indoor Scene Analysis2022

    • 著者名/発表者名
      Yoshiaki Sumura, Kouhei Sekiguchi, Yoshiaki Bando, Aditya Arie Nugraha, Kazuyoshi Yoshii
    • 学会等名
      IEEE International Workshop on Acoustic Signal Enhancement (IWAENC)
    • 国際学会
  • [学会発表] Elliptically Contoured Alpha-Stable Representation for MUSIC-Based Sound Source Localization2022

    • 著者名/発表者名
      Mathieu Fontaine, Diego Di Carlo, Kouhei Sekiguchi, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii
    • 学会等名
      European Signal Processing Conference (EUSIPCO)
    • 国際学会
  • [学会発表] Flow-Based Fast Multichannel Nonnegative Matrix Factorization for Blind Source Separation2022

    • 著者名/発表者名
      Aditya Arie Nugraha, Kouhei Sekiguchi, Mathieu Fontaine, Yoshiaki Bando, and Kazuyoshi Yoshii
    • 学会等名
      IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi