歌声知覚を考慮した統計的歌声声質制御法に関する研究

研究課題

研究課題/領域番号	16J10726
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	知能情報学
研究機関	名古屋大学 (2017) 奈良先端科学技術大学院大学 (2016)
研究代表者	小林和弘名古屋大学, 情報基盤センター, 特別研究員(PD)
研究期間 (年度)	2016-04-22 – 2018-03-31
研究課題ステータス	完了 (2017年度)
配分額 *注記	1,900千円 (直接経費: 1,900千円) 2017年度: 900千円 (直接経費: 900千円) 2016年度: 1,000千円 (直接経費: 1,000千円)
キーワード	知覚情報 / sprocket / 歌声声質変換 / 歌声声質制御 / 知覚年齢 / 混合正規分布モデル
研究実績の概要	本年度の研究実績の概要は下記のとおりである． [フリーライセンスの声質変換・制御基盤フレームワーク”sprocket”の開発と公開]　統計的声質変換・制御法に関するオープンソースソフトウェアとして，sprocketの開発・公開を実施した．本ソフトウェアに関する解説論文を執筆した．Voice Conversion Challenge2018において，ベースラインシステムとして利用される事が決まっており，今後，幅広い活躍が期待される． [歌声声質変換法に関する論文の執筆と投稿]　差分スペクトル補正に基づく歌声声質変換の研究成果を論文として執筆し，Speech Communication誌へと投稿した． [知覚情報を考慮した統計的声質制御法に関する国際会議論文の執筆]　本研究課題の核となる手法として，統計的声質制御法における，声質制御パラメータの設計法に関する研究成果を国際会議論文にまとめた．本論文は，声質制御を担う声質制御ベクトル空間において，複数の声質制御パラメータの独立性を確保し，よりユーザの知覚に合致した声質制御が実現する手法を提案する論文である．本研究成果は，評価対象として音声を用いて実施しているが，歌声声質制御においても適用可能な枠組みである．今後，歌声声質制御にも適用し，その性能を評価する予定である． [WaveNet vocoderによる声質変換・制御品質の向上]　深層学習を利用した，音声波形生成技術の一つとしてWaveNetがある．本研究では，このWaveNetのネットワークアーキテクチャを応用する枠組みとして，F0，スペクトル包絡情報，非周期性指標を補助特徴量とし，音声波形を生成するWaveNetボコーダを提案した．本提案法により，従来のボコーダの枠組みに比べて，より高い音質を持つ音声波形の生成が可能となった．
現在までの達成度 (段落)	29年度が最終年度であるため、記入しない。
今後の研究の推進方策	29年度が最終年度であるため、記入しない。

報告書

(2件)

2017 実績報告書
2016 実績報告書

研究成果
(13件)

すべて 2018 2017 2016 その他

すべて雑誌論文 (3件) (うち国際共著 3件、査読あり 3件、謝辞記載あり 1件) 学会発表 (7件) (うち国際学会 6件) 備考 (3件)

[雑誌論文] Intra-gender statistical singing voice conversion with direct waveform modification using log-spectral differential2018
- 著者名/発表者名
  K. Kobayashi, T. Toda, S. Nakamura
- 雑誌名
  
  Speech Communication
  
  巻: 99 ページ: 211-220
- 関連する報告書
  2017 実績報告書
- 査読あり / 国際共著
[雑誌論文] Articulatory controllable speech modification based on statistical inversion and production mappings2017
- 著者名/発表者名
  P.L. Tobing, K. Kobayashi, T. Toda
- 雑誌名
  
  IEEE Transactions on Audio, Speech and Language Processing
  
  巻: 25
- 関連する報告書
  2017 実績報告書
- 査読あり / 国際共著
[雑誌論文] Improvements of Voice Timbre Control Based on Perceived Age in Singing Voice Conversion2016
- 著者名/発表者名
  Kazuhiro Kobayashi, Tomoki Toda, Tomoyasu Nakano, Masataka Goto, Satoshi Nakamura
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E99.D 号: 11 ページ: 2767-2777
- DOI
  10.1587/transinf.2016EDP7234
- NAID
  130005268277
- ISSN
  0916-8532, 1745-1361
- 関連する報告書
  2016 実績報告書
- 査読あり / 国際共著 / 謝辞記載あり
[学会発表] 差分スペクトル補正に基づく声質変換におけるF0変換法の調査2017
- 著者名/発表者名
  小林和弘, 戸田智基, 中村哲
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県川崎市）
- 年月日
  2017-03-09
- 関連する報告書
  2016 実績報告書
[学会発表] Speaker-dependent WaveNet vocoder2017
- 著者名/発表者名
  A. Tamamori, K.Kobayashi, T. Hayashi, K. Takeda, T. Toda
- 学会等名
  INTERSPEECH
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] Statistical voice conversion with WaveNet-based waveform generation2017
- 著者名/発表者名
  K. Kobayashi, T. Hayashi, A. Tamamori, T. Toda
- 学会等名
  INTERSPEECH
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] An Investigation of how to design control parameters for statistical voice timbre control2017
- 著者名/発表者名
  K. Kubo, K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura
- 学会等名
  APSIPA
- 関連する報告書
  2017 実績報告書
- 国際学会
[学会発表] F0 transformation techniques for statistical voice conversion with direct waveform modification with spectral differential2016
- 著者名/発表者名
  Kazuhiro Kobayashi, Tomoki Toda and Satoshi Nakamura
- 学会等名
  Proc. SLT
- 発表場所
  San Diego, USA
- 年月日
  2016-12-13
- 関連する報告書
  2016 実績報告書
- 国際学会
[学会発表] Low delay statistical singing voice conversion with direct waveform modification based on spectral differential considering global variance2016
- 著者名/発表者名
  Kazuhiro Kobayashi, Tomoki Toda, Satoshi Nakamura
- 学会等名
  5th Joint Meeting of the ASA and the ASJ
- 発表場所
  Hawaii, USA
- 年月日
  2016-11-28
- 関連する報告書
  2016 実績報告書
- 国際学会
[学会発表] The NU-NAIST voice conversion system for the Voice Conversion Challenge 20162016
- 著者名/発表者名
  Kazuhiro Kobayashi, Shinnosuke Takamichi, Tomoki Toda and Satoshi Nakamura
- 学会等名
  Proc. INTERSPEECH
- 発表場所
  San Francisco, USA
- 年月日
  2016-09-08
- 関連する報告書
  2016 実績報告書
- 国際学会
[備考] 研究室HP
- URL
  https://www.toda.is.i.nagoya-u.ac.jp/publications_FY2017.html
- 関連する報告書
  2017 実績報告書
[備考] 個人HP
- URL
  https://scholar.google.co.jp/citations?user=c-AwXZQAAAAJ&hl=ja
- 関連する報告書
  2017 実績報告書
[備考] 知能コミュニケーション研究室のHP
- URL
  http://ahclab.naist.jp/index.html
- 関連する報告書
  2016 実績報告書

歌声知覚を考慮した統計的歌声声質制御法に関する研究

研究代表者

小林 和弘 名古屋大学, 情報基盤センター, 特別研究員(PD)

1,900千円 (直接経費: 1,900千円)

報告書

研究成果

[雑誌論文] Intra-gender statistical singing voice conversion with direct waveform modification using log-spectral differential2018

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Articulatory controllable speech modification based on statistical inversion and production mappings2017

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Improvements of Voice Timbre Control Based on Perceived Age in Singing Voice Conversion2016

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] 差分スペクトル補正に基づく声質変換におけるF0変換法の調査2017

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Speaker-dependent WaveNet vocoder2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] Statistical voice conversion with WaveNet-based waveform generation2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] An Investigation of how to design control parameters for statistical voice timbre control2017

著者名/発表者名

学会等名

関連する報告書

[学会発表] F0 transformation techniques for statistical voice conversion with direct waveform modification with spectral differential2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Low delay statistical singing voice conversion with direct waveform modification based on spectral differential considering global variance2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] The NU-NAIST voice conversion system for the Voice Conversion Challenge 20162016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[備考] 研究室HP

URL

関連する報告書

[備考] 個人HP

URL

関連する報告書

[備考] 知能コミュニケーション研究室のHP

URL

関連する報告書

小林和弘名古屋大学, 情報基盤センター, 特別研究員(PD)