2022 年度研究成果報告書

多様な歌唱入力に対応した楽曲検索システムの開発

研究課題

PDF

研究課題/領域番号	18K11321
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60080:データベース関連
研究機関	大阪工業大学
研究代表者	鈴木基之大阪工業大学, 情報科学部, 教授 (30282015)
研究期間 (年度)	2018-04-01 – 2023-03-31
キーワード	楽曲検索 / 歌唱音声認識 / 歌詞誤りに頑健な検索 / 歌詞の記憶誤り
研究成果の概要	本研究では歌唱音声を入力とした楽曲検索システムの構築を目的とし，様々な要素技術の開発を行った。まずは歌唱音声を高精度に認識する方法を開発した。歌唱は音符と音韻が対応していることから，音符の区切り時刻を利用した認識法を開発し，精度を向上させた。次に誤りを含む歌詞に頑健な検索方法を開発した。認識誤りに対しては単語系列ではなく音素系列を利用し，人間の記憶誤りに対しては，誤り傾向を検索スコアに反映させることで検索精度の向上を達成した。最後にメロディと歌詞それぞれから得られた検索結果を組み合わせる方法の検討を行った。検索位置をあわせることで精度向上を目指したが，期待されるほどの成果は得られなかった。
自由記述の分野	音声情報処理
研究成果の学術的意義や社会的意義	歌唱音声認識の精度向上に大きな貢献をした。歌唱音声の認識が難しい事は従来から知られていたが，音響モデルや言語モデルを適応させる程度しか対処法が提案されていなかった。本研究では音符の区切り時刻を利用する，という新たな発想を取り入れ，認識精度を大きく向上させることができた。更に歌唱音声において任意の位置に無音区間が挿入される可能性があること，それが認識性能を劣化させる大きな原因であった事を初めて明らかにした。また，歌詞を用いた楽曲検索において，認識誤りだけではなく，人間の記憶誤りにも注目し，適切に対処を行うことで検索精度を向上させたことも大きな貢献である。