2016 年度実績報告書

音楽の自動擬音語変換を用いたクラシック音楽用検索システムの開発

研究課題

研究課題/領域番号	25330140
研究機関	大阪工業大学
研究代表者	鈴木基之大阪工業大学, 情報科学部, 准教授 (30282015)
研究期間 (年度)	2013-04-01 – 2017-03-31
キーワード	擬音語歌唱 / 歌唱音声の認識 / 楽曲検索システム / 擬音語自動変換
研究実績の概要	前年度までの分析結果を元に，楽曲を擬音語へと自動変換するアルゴリズムの開発を行なった。音の波形を入力とし，それに関連するテキストを出力する，という意味においては，通常の音声認識と同様の構造となるため，HMMを用いた音声認識システムをベースとして開発を行なった。特徴量には，通常の音声認識で用いられるMFCCに加え，音高と音量も用いることで擬音語との対応をよりよく表現できるようにした。前年度開発した方法を用いて擬音語を自動で「単語」に分割し，n-gramを言語モデルとして擬音語への自動変換を行った。その結果，人間が同じ曲を擬音語で歌唱したテキストとの一致率は非常に低いものとなってしまったが，生成された擬音語を曲にあわせて視聴したところ，一部妥当である変換結果が得られていた。そこで80曲を変換した結果を人間により評価したところ，1曲の半分以上の部分で妥当であると判断された曲が20曲，部分的に妥当であると判断された曲まで含めると53曲が妥当な変換であると判断された。特に，ひとつの音符が長く演奏される部分は長音記号「ー」に，またスタッカートのような奏法の部分は促音「っ」に，力強く演奏された音は濁音に変換されるなど，特徴的な演奏部分の多くは妥当な擬音語に変換されていた。また，前年度開発した時間制約を導入した歌唱音声認識法を改良し，より精度を高めた。時間制約には音符の区切り時刻情報を用いているが，実際は区切り時刻の推定ミス等があるため，認識性能が劣化しない範囲において，適切に制約を緩める必要がある。そこで音節間遷移の確率を制御する方法を提案し，最適な設定をすることで単語正解精度を92.0%にまで高めることに成功した。
備考	NLP-KE'16の発表において，Best paper award を受賞。

研究成果

(4件)

すべて 2017 2016

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件、謝辞記載あり 1件) 学会発表 (3件) (うち国際学会 2件)

[雑誌論文] Development of Singing-by-Onomatopoeia corpus for Query-by-Singing Music Information Retrieval system2017
- 著者名/発表者名
  Motoyuki Suzuki, Akimitsu Hisaoka.
- 雑誌名
  
  International Journal of Advanced Intelligence
  
  巻: 9 ページ: 63-75
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] 音符区切り情報を用いた高精度歌唱音声認識2017
- 著者名/発表者名
  鈴木基之，杉田裕亮．
- 学会等名
  情報処理学会音楽情報科学研究会
- 発表場所
  お茶の水女子大学（東京都文京区）
- 年月日
  2017-06-17 – 2017-06-18
[学会発表] Development of Singing-by-Onomatopoeia corpus for Query-by-Singing Music Information Retrieval system2016
- 著者名/発表者名
  Motoyuki Suzuki, Akimitsu Hisaoka.
- 学会等名
  International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE'16)
- 発表場所
  沖縄県市町村自治会館（沖縄県那覇市）
- 年月日
  2016-12-14 – 2016-12-16
- 国際学会
[学会発表] Automatic motion selection method for spoken dialog scenario editor2016
- 著者名/発表者名
  Motoyuki Suzuki, Kohei Kawashima.
- 学会等名
  Annual Conference on Knowledge-Based and Intelligent Information & Engineering Systems (KES2016)
- 発表場所
  Park Inn by Radisson York City Centre（英国・ヨーク）
- 年月日
  2016-09-05 – 2016-09-07
- 国際学会

2016 年度 実績報告書

音楽の自動擬音語変換を用いたクラシック音楽用検索システムの開発

研究代表者

鈴木 基之 大阪工業大学, 情報科学部, 准教授 (30282015)

研究成果

[雑誌論文] Development of Singing-by-Onomatopoeia corpus for Query-by-Singing Music Information Retrieval system2017

著者名/発表者名

雑誌名

[学会発表] 音符区切り情報を用いた高精度歌唱音声認識2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Development of Singing-by-Onomatopoeia corpus for Query-by-Singing Music Information Retrieval system2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Automatic motion selection method for spoken dialog scenario editor2016

著者名/発表者名

学会等名

発表場所

年月日

2016 年度実績報告書

鈴木基之大阪工業大学, 情報科学部, 准教授 (30282015)