• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多様な歌唱入力に対応した楽曲検索システムの開発

研究課題

研究課題/領域番号 18K11321
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60080:データベース関連
研究機関大阪工業大学

研究代表者

鈴木 基之  大阪工業大学, 情報科学部, 教授 (30282015)

研究期間 (年度) 2018-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード楽曲検索 / 歌唱音声認識 / 歌詞誤りに頑健な検索 / 歌詞の記憶誤り / Query-by-Singing / 楽曲検索システム / 検索スコアの統合 / 大語彙言語モデル / 音素系列による検索 / 歌詞認識 / 擬音語歌唱
研究成果の概要

本研究では歌唱音声を入力とした楽曲検索システムの構築を目的とし,様々な要素技術の開発を行った。まずは歌唱音声を高精度に認識する方法を開発した。歌唱は音符と音韻が対応していることから,音符の区切り時刻を利用した認識法を開発し,精度を向上させた。
次に誤りを含む歌詞に頑健な検索方法を開発した。認識誤りに対しては単語系列ではなく音素系列を利用し,人間の記憶誤りに対しては,誤り傾向を検索スコアに反映させることで検索精度の向上を達成した。
最後にメロディと歌詞それぞれから得られた検索結果を組み合わせる方法の検討を行った。検索位置をあわせることで精度向上を目指したが,期待されるほどの成果は得られなかった。

研究成果の学術的意義や社会的意義

歌唱音声認識の精度向上に大きな貢献をした。歌唱音声の認識が難しい事は従来から知られていたが,音響モデルや言語モデルを適応させる程度しか対処法が提案されていなかった。本研究では音符の区切り時刻を利用する,という新たな発想を取り入れ,認識精度を大きく向上させることができた。更に歌唱音声において任意の位置に無音区間が挿入される可能性があること,それが認識性能を劣化させる大きな原因であった事を初めて明らかにした。
また,歌詞を用いた楽曲検索において,認識誤りだけではなく,人間の記憶誤りにも注目し,適切に対処を行うことで検索精度を向上させたことも大きな貢献である。

報告書

(6件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 研究成果

    (7件)

すべて 2020 2019 2018

すべて 雑誌論文 (4件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] 音符区切り情報を用いた高精度歌唱音声認識2020

    • 著者名/発表者名
      鈴木 基之,杉田 裕亮
    • 雑誌名

      情報処理学会論文誌

      巻: 61 号: 4 ページ: 798-806

    • DOI

      10.20729/00204230

    • NAID

      170000181822

    • 年月日
      2020-04-15
    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [雑誌論文] Lyrics Recognition from Singing Voice Focused on Correspondence Between Voice and Notes2019

    • 著者名/発表者名
      Suzuki Motoyuki、Tomita Sho、Morita Tomoki
    • 雑誌名

      Proc. INTERSPEECH 2019

      巻: - ページ: 3238-3241

    • DOI

      10.21437/interspeech.2019-1318

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 主旋律に注目したクラシック音楽の自動擬音語変換2019

    • 著者名/発表者名
      鈴木 基之,竹中 智美
    • 雑誌名

      情報処理学会研究報告 音楽情報科学

      巻: 2019-MUS-123 ページ: 1-5

    • 関連する報告書
      2019 実施状況報告書
  • [雑誌論文] 音符区切り位置の推定誤りに頑健な高精度歌唱音声認識2018

    • 著者名/発表者名
      鈴木基之, 富田翔
    • 雑誌名

      情報処理学会研究報告

      巻: 2018-MUS-119 ページ: 1-4

    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Lyrics Recognition from Singing Voice Focused on Correspondence Between Voice and Notes2019

    • 著者名/発表者名
      Suzuki Motoyuki
    • 学会等名
      INTERSPEECH 2019
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [学会発表] 主旋律に注目したクラシック音楽の自動擬音語変換2019

    • 著者名/発表者名
      鈴木 基之
    • 学会等名
      情報処理学会 音楽情報科学研究会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 音符区切り位置の推定誤りに頑健な高精度歌唱音声認識2018

    • 著者名/発表者名
      鈴木基之
    • 学会等名
      情報処理学科 音楽情報科学研究会
    • 関連する報告書
      2018 実施状況報告書

URL: 

公開日: 2018-04-23   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi