2017 年度実績報告書

「自然な非人間性」に着目した新たな歌唱デザイン論の研究

研究課題

研究課題/領域番号	16K12511
研究機関	山梨大学
研究代表者	森勢将雅山梨大学, 大学院総合研究部, 准教授 (60510013)
研究分担者	能勢隆東北大学, 工学研究科, 准教授 (90550591)
研究期間 (年度)	2016-04-01 – 2018-03-31
キーワード	感性情報学 / 歌声情報処理 / 統計的歌声合成
研究実績の概要	本研究は，すでに人間と遜色のない品質で合成可能な歌声合成技術の次のステップとして，人間には発声不可能だがコンテンツとして成立しうる「自然な非人間性」を有する歌声の合成技術開発を目標としている．具体的には，人間には発声することが不可能な特徴と，自然性を両立する音声パラメータを策定することが課題となる．ここでは，これまでの検討で開発した音声分析合成システムを活用し，人間の歌声が持つ揺らぎに着目して人間的に感じる知覚範囲を明らかにする心理実験を実施した．また，現在主流の統計的歌声合成に応用するため，音声のパラメータ表現を効率的に表現するための音声符号化に取り組んだ． H29年度は，初年度の検討結果を受けて，入力された歌声と，その歌声から特定のパラメータを取り除いた歌声を利用し，特定のパラメータを誇張する信号処理技術を開発した．この技術を活用することで，例えば，人間の声に含まれる揺らぎや，ビブラートの速さ，深さを誇張することが可能になる．本年度は，特定のパラメータを誇張し，自然性を保ったまま非人間的に加工可能な音声パラメータの範囲を心理実験により確認した．その結果，前年度の実験と同様に，基本周波数（高さ）とスペクトル包絡（音色）では，音色の変化に敏感であること，高さについては揺らぎを2倍程度に誇張しても人間性がある程度は保たれることが示された．音声符号化については，フルバンド音声を対象とした，符号化前の合成音と比較して品質劣化を伴わない符号化を検討した．現在1フレームにつき基本周波数1次元，スペクトル包絡と非周期性指標がそれぞれ1025次元で表現している音声パラメータについて，品質の低下が起こらない条件化での符号化について検討した．音色についてはメルケプストラムを用いて50次元へ，非周期性指標については，帯域毎の代表値を用いることで，5次元まで圧縮できることを示した．

研究成果
(11件)

すべて 2018 2017 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (7件) (うち国際学会 1件) 備考 (1件)

[雑誌論文] Sound quality comparison among high-quality vocoders by using re-synthesized speech2018
- 著者名/発表者名
  M. Morise and Y. Watanabe
- 雑誌名
  
  Acoust. Sci. & Tech.
  
  巻: 39 ページ: 263-265
- 査読あり / オープンアクセス
[雑誌論文] Low-dimensional representation of spectral envelope without deterioration for full-band speech analysis/synthesis system2017
- 著者名/発表者名
  M. Morise, G. Miyashita, and K. Ozawa
- 雑誌名
  
  in Proc. INTERSPEECH 2017
  
  巻: - ページ: 409-413
- 査読あり / オープンアクセス
[雑誌論文] Harvest: A high-performance fundamental frequency estimator from speech signals2017
- 著者名/発表者名
  M. Morise
- 雑誌名
  
  in Proc. INTERSPEECH 2017
  
  巻: - ページ: 2321-2325
- 査読あり / オープンアクセス
[学会発表] Time-series evaluation of men's preferences perceived from female speech2018
- 著者名/発表者名
  T. Shono
- 学会等名
  NCSP 2018
- 国際学会
[学会発表] 高品質音声符号化のためのスペクトル包絡・非周期性指標量子化の知覚的影響2018
- 著者名/発表者名
  宮下玄太
- 学会等名
  電子情報通信学会技術研究報告
[学会発表] 演技発話による疲労の表現によって生じる音色変化の分析2018
- 著者名/発表者名
  生野琢郎
- 学会等名
  電子情報通信学会技術研究報告
[学会発表] 高品質音声分析合成による各パラメータのフレームシフト幅が音質に与える影響2018
- 著者名/発表者名
  宮下玄太
- 学会等名
  電子情報通信学会技術研究報告
[学会発表] 誇張した時間的揺らぎが歌声の人間性知覚に与える影響2017
- 著者名/発表者名
  森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
[学会発表] フルバンド音声を対象とした音声分析合成システムに用いるスペクトル包絡の音質劣化のない低次元表現2017
- 著者名/発表者名
  宮下玄太
- 学会等名
  情報処理学会音楽情報科学研究会
[学会発表] 高品質音声分析合成を用いた基本周波数の実時間操作インタフェースの実装2017
- 著者名/発表者名
  渡邊優介
- 学会等名
  情報処理学会音楽情報科学研究会
[備考] 音声分析合成システムWORLD
- URL
  http://www.kki.yamanashi.ac.jp/~mmorise/world/english/index.html

2017 年度 実績報告書

「自然な非人間性」に着目した新たな歌唱デザイン論の研究

研究代表者

森勢 将雅 山梨大学, 大学院総合研究部, 准教授 (60510013)

研究成果

[雑誌論文] Sound quality comparison among high-quality vocoders by using re-synthesized speech2018

著者名/発表者名

雑誌名

[雑誌論文] Low-dimensional representation of spectral envelope without deterioration for full-band speech analysis/synthesis system2017

著者名/発表者名

雑誌名

[雑誌論文] Harvest: A high-performance fundamental frequency estimator from speech signals2017

著者名/発表者名

雑誌名

[学会発表] Time-series evaluation of men's preferences perceived from female speech2018

著者名/発表者名

学会等名

[学会発表] 高品質音声符号化のためのスペクトル包絡・非周期性指標量子化の知覚的影響2018

著者名/発表者名

学会等名

[学会発表] 演技発話による疲労の表現によって生じる音色変化の分析2018

著者名/発表者名

学会等名

[学会発表] 高品質音声分析合成による各パラメータのフレームシフト幅が音質に与える影響2018

著者名/発表者名

学会等名

[学会発表] 誇張した時間的揺らぎが歌声の人間性知覚に与える影響2017

著者名/発表者名

学会等名

[学会発表] フルバンド音声を対象とした音声分析合成システムに用いるスペクトル包絡の音質劣化のない低次元表現2017

著者名/発表者名

学会等名

[学会発表] 高品質音声分析合成を用いた基本周波数の実時間操作インタフェースの実装2017

著者名/発表者名

学会等名

[備考] 音声分析合成システムWORLD

URL

2017 年度実績報告書

森勢将雅山梨大学, 大学院総合研究部, 准教授 (60510013)