2020 Fiscal Year Annual Research Report
PRISM: Speech privacy preservation based on selecting masking
Project/Area Number |
18H04112
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
徳田 恵一 名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)
|
Co-Investigator(Kenkyū-buntansha) |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)
南角 吉彦 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
橋本 佳 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (10635907)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 音声情報処理 / 音声プライバシー / 音声合成 |
Outline of Annual Research Achievements |
実空間における音声プライバシー保護技術については、主に個人性と発話内容を対象とし、これらの情報を隠蔽するマスキング信号の生成技術について検討を進めてきた。今年度は利用者の立場でのプライバシー感の評価やマスキング信号により周囲に迷惑をかけていると感じるかなどについて評価だけでなく、第3者がマスキング音をどのように感じるかなどを含んだ評価を行い、提案手法の有効性を確認した。
収録済みの音声データを対象としたプライバシー保護技術(「サイバースペースにおける音声プライバシー保護技術」)については、そこで、音声の自然性や音声から知覚可能な年代や性別といった話者の属性情報を保ったまま、音声の個人性を変えることを目的とする話者匿名化を提案した。これは、音声を抑揚、音素情報、xベクトルという話者性を表すベクトルの3つの情報に分解し、xベクトルのみを近傍のK人の話者と平均化することで匿名化する手法である。音声波形を再合成するモジュールにはニューラルソースフィルタを利用し、高品質な音声生成を可能にした。英語話者の音声データを利用した実験から、xベクトルの空間において、k匿名化を行うことで、話者認識システムおよび人間の聴覚上の話者識別性能が有意に下がることを確認した。さらに、単なる平均値によるK匿名化ではなく、話者空間における確率密度の混合分布を考慮した改良版も提案した。
この様な話者匿名化技術の適切な評価には、単なる変換音声の品質や話者認識精度による比較だけでなく、より適切な指標に基づく評価・分析が必要である。そこで話者匿名化後の音声が再識別化される最悪リスクに基づいて評価を行う指標も提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ここまでに実空間における音声プライバシー保護技術、サイバースペースにおける音声プライバシー保護技術について多方面から網羅的な研究を進めており、基礎研究も含め、順調に成果を挙げている。このため、当初の計画通りに進展していると言える。
|
Strategy for Future Research Activity |
引き続き、収録済みの音声データを対象としたプライバシー保護技術(「サイバースペースにおける音声プライバシー保護技術」)と実空間における音声を対象としたプライバシー保護技術(「実空間における音声プライバシー保護技術」)の2つの技術の構築に取り組むとともに、評価実験により研究全体のまとめを行う。
実空間における音声プライバシー保護技術については、主に個人性と発話内容を対象とし、これらの情報を隠蔽するマスキング信号の生成技術について検討を進めてきた。今後は、実際の公共空間あるいはそれと同等の環境において、利用者の立場でのプライバシー感の評価やマスキング信号により周囲に迷惑をかけていると感じるか、第3者がマスキング音をどのように感じるかなどを含んだ評価実験を行い、その結果に基づいてより高度で快適なマスキング信号生成技術としてまとめる。
サイバースペースにおける音声プライバシー保護技術に関して、話者匿名化の有効性を厳密に示すには、これまでに設定した評価法に加え、話者匿名化された音声が再識別不可能であること、そして、匿名化された音声が他の用途に有用である事も示す必要がある。匿名化済みの音声に対する再識別困難性を実証するためには、スキルの異なる再識別攻撃者を複数想定する必要がある。予備実験からは、前述した話者匿名化法は、高度なスキルを利用した再識別攻撃により個人が特定される可能性がある事がわかっている。このため、より厳密な再識別評価および再識別攻撃に対しても耐性がある話者匿名化法の確立を目指す。また、音声のプライバシーに関する研究は、現在、基盤ツールや評価用データベースが整っていない状態である。相互比較や研究加速のために、データベース公開やオープンソース公開など研究インフラ整備も引き続き行う。
|
Research Products
(27 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Introducing the VoicePrivacy Initiative2020
Author(s)
Natalia Tomashenko, Brij Mohan Lal Srivastava, Xin Wang, Emmanuel Vincent, Andreas Nautsch, Junichi Yamagishi, Nicholas Evans, Jose Patino, Jean-Fran?ois Bonastre, Paul-Gauthier No?, Massimiliano Todisco
Organizer
Interspeech 2020
Int'l Joint Research
-
-
-
-
-
-
-
-