歌声ビッグデータを活用した歌声の多様性を考慮する歌声情報処理

研究課題

研究課題/領域番号	17K12721
研究種目	若手研究(B)
配分区分	基金
研究分野	知覚情報処理
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	中野倫靖国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)
研究期間 (年度)	2017-04-01 – 2019-03-31
研究課題ステータス	完了 (2018年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2018年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円) 2017年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
キーワード	歌声情報処理 / 信号処理 / 機械学習 / インタフェース / 情報可視化 / 音楽情報処理 / 歌声分析 / 歌声合成
研究成果の概要	本研究では、歌声に関する大規模データセット（歌声ビッグデータ）を用いて、歌声の多様性をモデル化する要素技術開発を行った。具体的には、楽曲中の歌声分析精度向上のために、どこに歌声があるのかを推定する技術、歌詞のどの音素がいつ歌われているかを推定する技術、音高推定と歌声の分離再合成技術を、確率モデルや深層学習に基づいた手法により性能向上した。また、無伴奏の歌声のスペクトル包絡を高精度に推定する基礎技術を開発した。さらに、それらを応用するため、「何を・どう歌っているか」を同時に可視化するインタフェース、歌声の繰り返しを活用したアノテーションのための新しい歌声可視化インタフェースを実現した。
研究成果の学術的意義や社会的意義	音楽に含まれる歌声は処理が難しく未解決で本質的な課題が多い。一方で、産業・文化の両面で主要なコンテンツである音楽における最も重要な要素の一つである。したがって、学術的および産業応用的な観点からの注目度が高い。本研究の成果における歌詞同期、音高推定、歌声分離等の混合音中の歌声分析技術は、世界的に活発に研究されており、その性能向上は学術的・産業応用的に意義がある。また、そのような要素技術の性能向上が、社会・エンドユーザの音楽活動を豊かにするためには、適切なインタフェースや可視化が必要不可欠であり、その新しい技術を実現した点でも社会的に意義がある。

報告書

(3件)

2018 実績報告書研究成果報告書 ( PDF )
2017 実施状況報告書

研究成果
(5件)

すべて 2019 2018 2017

すべて学会発表 (5件) (うち国際学会 3件、招待講演 1件)

[学会発表] Autocomplete Vocal-fo Annotation of Songs Using Musical Repetitions2019
- 著者名/発表者名
  Nakano Tomoyasu, Koyama Yuki, Hamasaki Masahiro, Goto Masataka
- 学会等名
  The 24th International Conference on Intelligent User Interfaces (ACM IUI 2019)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] TextTimeline: Visualizing Vocalized Timing of Singing Voice along Display Text2019
- 著者名/発表者名
  Nakano Tomoyasu, Jun Kato, Goto Masataka
- 学会等名
  The 2nd Workshop on Intelligent Music Interfaces for Listening and Creation (MILC 2019)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] 音楽・歌声情報処理に基づくインタフェース構築と可視化2018
- 著者名/発表者名
  中野倫靖
- 学会等名
  電子情報通信学会および日本音響学会音声研究会(SP)
- 関連する報告書
  2018 実績報告書
- 招待講演
[学会発表] TextTimeline: Visualizing Acoustic Features and Vocalized Timing along Display Text2018
- 著者名/発表者名
  Tomoyasu Nakano, Jun Kato, Masataka Goto
- 学会等名
  The 11th IEEE Pacific Visualization Symposium (PacificVis 2018)
- 関連する報告書
  2017 実施状況報告書
- 国際学会
[学会発表] TextTimeline: 文字表示を保持した発話テキストの音響特徴可視化2017
- 著者名/発表者名
  中野倫靖, 加藤淳, 後藤真孝
- 学会等名
  情報処理学会第116回音楽情報科学研究会
- 関連する報告書
  2017 実施状況報告書

歌声ビッグデータを活用した歌声の多様性を考慮する歌声情報処理

研究代表者

中野 倫靖 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

報告書

研究成果

[学会発表] Autocomplete Vocal-fo Annotation of Songs Using Musical Repetitions2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] TextTimeline: Visualizing Vocalized Timing of Singing Voice along Display Text2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] 音楽・歌声情報処理に基づくインタフェース構築と可視化2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] TextTimeline: Visualizing Acoustic Features and Vocalized Timing along Display Text2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] TextTimeline: 文字表示を保持した発話テキストの音響特徴可視化2017

著者名/発表者名

学会等名

関連する報告書

中野倫靖国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)