2018 Fiscal Year Annual Research Report

Singing information processing considering diversity of singing voice utilizing singing big data

Research Project

Project/Area Number	17K12721
Research Institution	National Institute of Advanced Industrial Science and Technology
Principal Investigator	中野倫靖国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)
Project Period (FY)	2017-04-01 – 2019-03-31
Keywords	歌声情報処理 / 信号処理 / 機械学習 / インタフェース / 情報可視化
Outline of Annual Research Achievements	本研究では、歌声ビッグデータからの歌声空間の構築に基づく歌声合成品質の向上と、歌声空間の応用（インタフェース）を目的としている。従来、歌声合成には無伴奏の歌声が用いられていたが、伴奏等の背景音を伴う歌声（混合音）も対象として、より多様な声質や歌い方に適用可能とする。そのために、混合音からの歌声特徴の高精度な抽出が必要となる。まず、無伴奏の歌声を対象にそのスペクトル包絡を高精度に推定する基礎技術の開発に引き続き取り組み、より性能を向上させることができた。また、音楽に含まれる歌声（ボーカル）からの音高抽出と歌声信号の分離再合成技術を開発し、その性能向上を確認できた。本手法は歌声ビッグデータを活用可能な深層学習の枠組みを用いて実現した。応用展開として、多様な合成に特化した歌声インタフェース構築のために、歌声の繰り返しを活用する新しい歌声可視化方法を実現した。ここでは、伴奏を含んだ歌声を活用する上で、音楽に含まれるボーカルの音高をアノテーションする新しいインタフェースを開発した。ソースコードエディタや表計算ソフトウェアで使用されるオートコンプリート機能のように、繰り返される類似区間を同時に可視化しながらアノテーションでき、既にアノテーションした結果を類似区間に反映させることができる。このような音楽の繰り返し構造の活用は、アノテーションだけではなく、歌声合成を用いた楽曲制作における発展につながると考えている。

Research Products
(3 results)

All 2019 2018

All Presentation (3 results) (of which Int'l Joint Research: 2 results, Invited: 1 results)

[Presentation] Autocomplete Vocal-fo Annotation of Songs Using Musical Repetitions2019
- Author(s)
  Nakano Tomoyasu, Koyama Yuki, Hamasaki Masahiro, Goto Masataka
- Organizer
  The 24th International Conference on Intelligent User Interfaces (ACM IUI 2019)
- Int'l Joint Research
[Presentation] TextTimeline: Visualizing Vocalized Timing of Singing Voice along Display Text2019
- Author(s)
  Nakano Tomoyasu, Jun Kato, Goto Masataka
- Organizer
  The 2nd Workshop on Intelligent Music Interfaces for Listening and Creation (MILC 2019)
- Int'l Joint Research
[Presentation] 音楽・歌声情報処理に基づくインタフェース構築と可視化2018
- Author(s)
  中野倫靖
- Organizer
  電子情報通信学会および日本音響学会音声研究会(SP)
- Invited

2018 Fiscal Year Annual Research Report

Singing information processing considering diversity of singing voice utilizing singing big data

Principal Investigator

中野 倫靖 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)

Research Products

[Presentation] Autocomplete Vocal-fo Annotation of Songs Using Musical Repetitions2019

Author(s)

Organizer

[Presentation] TextTimeline: Visualizing Vocalized Timing of Singing Voice along Display Text2019

Author(s)

Organizer

[Presentation] 音楽・歌声情報処理に基づくインタフェース構築と可視化2018

Author(s)

Organizer

中野倫靖国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10572927)