• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

PRISM: Speech privacy preservation based on selecting masking

Research Project

Project/Area Number 18H04112
Research InstitutionNagoya Institute of Technology

Principal Investigator

徳田 恵一  名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)

Co-Investigator(Kenkyū-buntansha) 山岸 順一  国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)
南角 吉彦  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
橋本 佳  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (10635907)
Project Period (FY) 2018-04-01 – 2022-03-31
Keywords音声情報処理 / 音声プライバシー / 音声合成
Outline of Annual Research Achievements

本研究では、音声に含まれるプライバシー情報を分離・変換可能な形で音声をモデル化することで、音声モデリングによる統一的な枠組みによって選択的にプライバシー情報を保護可能にする、次世代音声プライバシー保護技術 (PRISM: PRIvacy Selecting Masking)を確立することを目的とする。
実空間における音声プライバシー保護技術の確立については、主に個人性と発話内容を対象とし、これらの情報を隠蔽するマスキング信号の生成技術について検討を進めてきた。利用者の合成音声を用いたマスキング信号の生成に取り組み、主観評価実験により、利用者の声質の合成音声を用いることで、ホワイトノイズやピンクノイズ、さらには他人の声質の合成音声に対して、より高いマスキング効果が得られることを示したが、本年度は、更に利用者の立場でのプライバシー感の評価やマスキング信号により周囲に迷惑をかけていると感じるかなど、網羅的な評価を行い有効性を示した。
収録済みの音声データを対象としたプライバシー保護技術(「サイバースペースにおける音声プライバシー保護技術」)については、話者照合システムもしくは人間に、個人を特定されない様に音声を自動的に匿名化する技術「話者匿名化」に関する研究を行った。本枠組みでは、まず音声を、話者埋め込みベクトル、音素事後確率、基本周波数の3要素に分解し、次に、話者埋め込みベクトルを周辺話者と平均化させ、最後に、ニューラルボコーダにより高品質な音声を再合成する。これにより、言語情報と音韻性を保ったまま、元話者とは異なる話者へ変換することを実現した。音声の品質劣化は比較的少ないにもかかわらず、話者照合システムの照合誤りを非常に高められることが確認できた。また聴覚的にも個人を特定しにくくなることも確認できた。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

ここまでに実空間における音声プライバシー保護技術、サイバースペースにおける音声プライバシー保護技術について多方面から網羅的な研究を進めており、基礎研究も含め、多くの成果を挙げている。このため、当初の計画以上に進展していると言える。

Strategy for Future Research Activity

引き続き、収録済みの音声データを対象としたプライバシー保護技術(「サイバースペースにおける音声プライバシー保護技術」)と実空間における音声を対象としたプライバシー保護技術(「実空間における音声プライバシー保護技術」)の2つの技術の構築に取り組む。
実空間における音声プライバシー保護技術については、主に個人性と発話内容を対象とし、これらの情報を隠蔽するマスキング信号の生成技術について検討を進めてきた。今後は、利用者の立場でのプライバシー感の評価やマスキング信号により周囲に迷惑をかけていると感じるかなどについて評価だけでなく、第3者がマスキング音をどのように感じるかなどを含んだ評価を行い、その結果に基づいてより高度で快適なマスキング信号生成技術の研究に取り組む。
サイバースペースにおける音声プライバシー保護技術に関して、話者匿名化の有効性を厳密に示すには、上記の評価に加え、話者匿名化された音声が再識別不可能であること、そして、匿名化された音声が他の用途に有用である事も示す必要がある。匿名化済みの音声に対する再識別困難性を実証するためには、スキルの異なる再識別攻撃者を複数想定する必要がある。予備実験からは、前述した話者匿名化法は、高度なスキルを利用した再識別攻撃により個人が特定される可能性がある事がわかっている。今後は、より厳密な再識別評価および再識別攻撃に対しても耐性がある話者匿名化法を検討する。また、音声のプライバシーに関する研究は、現在、基盤ツールや評価用データベースが存在していない。相互比較や研究加速のために、データベース公開やオープンソース公開など研究インフラ整備も鋭意行う予定である。

  • Research Products

    (28 results)

All 2020 2019 Other

All Int'l Joint Research (2 results) Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results) Presentation (22 results) (of which Int'l Joint Research: 15 results,  Invited: 2 results) Remarks (2 results)

  • [Int'l Joint Research] 国立情報学自動制御研究所 (INRIA)/Eurecom研究所/アビニョン大学(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      国立情報学自動制御研究所 (INRIA)/Eurecom研究所/アビニョン大学
  • [Int'l Joint Research] エジンバラ大学/シェフィールド大学(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      エジンバラ大学/シェフィールド大学
  • [Journal Article] A Vector Quantized Variational Autoencoder (VQ-VAE) Autoregressive Neural F0 Model for Statistical Parametric Speech Synthesis2019

    • Author(s)
      Xin Wang, Shinji Takaki, Junichi Yamagishi, Simon King, Keiichi Tokuda
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      Volume: 28 Pages: 157-170

    • DOI

      10.1109/TASLP.2019.2950099

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Neural source-filter waveform models for statistical parametric speech synthesis2019

    • Author(s)
      Xin Wang, Shinji Takaki, Junichi Yamagishi
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      Volume: 28 Pages: 402-415

    • DOI

      10.1109/TASLP.2019.2956145

    • Peer Reviewed
  • [Presentation] End-to-End音声合成のための階層化生成モデルに基づく半教師あり学習2020

    • Author(s)
      藤本崇人, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一
    • Organizer
      日本音響学会2020年春季研究発表会
  • [Presentation] 楽譜時間情報を用いたアテンション機構に基づく歌声合成の検討2019

    • Author(s)
      村田舜馬, 藤本崇人, 法野行哉, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一
    • Organizer
      日本音響学会2019年秋季研究発表会
  • [Presentation] Audiovisual speaker conversion: jointly and simultaneously transforming facial expression and acoustic characteristics2019

    • Author(s)
      Fuming Fang, Xin Wang, Junichi Yamagishi, Isao Echizen
    • Organizer
      2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] Waveform generation for text-to-speech synthesis using pitch-synchronous multi-scale generative adversarial networks2019

    • Author(s)
      Lauri Juvela, Bajibabu Bollepalli, Junichi Yamagishi, Paavo Alku
    • Organizer
      2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] Investigation of enhanced Tacotron text-to-speech synthesis systems with self-attention for pitch accent language2019

    • Author(s)
      Yusuke Yasuda, Xin Wang, Shinji Takaki, Junichi Yamagishi
    • Organizer
      2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] Neural source-filter-based waveform model for statistical parametric speech synthesis2019

    • Author(s)
      Xin Wang, Shinji Takaki, Junichi Yamagishi
    • Organizer
      2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] STFT spectral loss for training a neural speech waveform model2019

    • Author(s)
      Shinji Takaki, Toru Nakashika, Xin Wang, Junichi Yamagishi
    • Organizer
      2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
    • Int'l Joint Research
  • [Presentation] 周期・非周期信号を用いたDNNに基づくリアルタイム音声ボコーダ2019

    • Author(s)
      大浦圭一郎, 中村和寛, 橋本佳, 南角吉彦, 徳田恵一
    • Organizer
      情報処理学会研究報告
  • [Presentation] 周期・非周期信号を用いた敵対的生成ネットワークに基づくリアルタイム音声ボコーダ2019

    • Author(s)
      大浦圭一郎, 高木信二, 中村和寛, 橋本佳, 南角吉彦, 徳田恵一
    • Organizer
      日本音響学会2019年秋季研究発表会
  • [Presentation] Statistical approach to speech synthesis: past, present and future2019

    • Author(s)
      Keiichi Tokuda
    • Organizer
      Interspeech 2019
    • Int'l Joint Research / Invited
  • [Presentation] GELP: GAN-Excited Liner Prediction for Speech Synthesis from Mel-spectrogram2019

    • Author(s)
      Lauri Juvela, Bajibabu Bollepalli, Junichi Yamagishi, Paavo Alku
    • Organizer
      Interspeech 2019
    • Int'l Joint Research
  • [Presentation] Joint training framework for text-to-speech and voice conversion using multi-source Tacotron and WaveNet2019

    • Author(s)
      Mingyang Zhang, Xin Wang, Fuming Fang, Haizhou Li, Junichi Yamagishi
    • Organizer
      Interspeech 2019
    • Int'l Joint Research
  • [Presentation] Deep neural network based real-time speech vocoder with periodic and aperiodic inputs2019

    • Author(s)
      Keiichiro Oura, Kazuhiro Nakamura, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] Impacts of input linguistic feature representation on Japanese end-to-end speech synthesis2019

    • Author(s)
      Takato Fujimoto, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] Low computational cost speech synthesis based on deep neural networks using hidden semi-Markov model structures2019

    • Author(s)
      Motoki Shimada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] Speaker Anonymization Using X-vector and Neural Waveform Models2019

    • Author(s)
      Fuming Fang, Xin Wang, Junichi Yamagishi, Isao Echizen, Massimiliano Todisco, Nicholas Evans,Jean-Francois Bonastre
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] Initial investigation of encoder-decoder end-to-end TTS using marginalization of monotonic hard alignments2019

    • Author(s)
      Yusuke Yasuda, Xin Wang, Junichi Yamagishi
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] Neural Harmonic-plus-Noise Waveform Model with Trainable Maximum Voice Frequency for Text-to-Speech Synthesis2019

    • Author(s)
      Xin Wang, Junichi Yamagishi
    • Organizer
      10th ISCA Speech Synthesis Workshop (SSW10)
    • Int'l Joint Research
  • [Presentation] 統計的音声合成の進展と展望2019

    • Author(s)
      徳田恵一
    • Organizer
      音声研究会
    • Invited
  • [Presentation] 公共空間におけるスピーチプライバシー保護を目的とした合成音声によるサウンドマスキングの検討2019

    • Author(s)
      次井貴浩, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一
    • Organizer
      音声研究会
  • [Presentation] 歌声合成におけるニューラルボコーダの比較検討2019

    • Author(s)
      和田蒼汰, 法野行哉, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一
    • Organizer
      音声研究会
  • [Presentation] BOOTSTRAPPING NON-PARALLEL VOICE CONVERSION FROM SPEAKER-ADAPTIVE TEXT-TO-SPEECH2019

    • Author(s)
      Hieu-Thi Luong, Junichi Yamagishi
    • Organizer
      IEEE ASRU 2019
    • Int'l Joint Research
  • [Remarks] VoicePrivacy initiative

    • URL

      https://www.voiceprivacychallenge.org/

  • [Remarks] Baseline Recipe for VoicePrivacy Challenge 2020

    • URL

      https://github.com/Voice-Privacy-Challenge/Voice-Privacy-Challenge-2020

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi