人工音声による話者認識器詐称防止に関する研究

研究課題

研究課題/領域番号	19K11975
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60070:情報セキュリティ関連
研究機関	大同大学
研究代表者	柘植覚大同大学, 情報学部, 教授 (00325250)
研究期間 (年度)	2019-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	話者認識 / バイオメトリクス認証 / 個人認証 / 人工音声 / 情報セキュリティ
研究開始時の研究の概要	近未来に到達するIoT（Internet of Things）時代では、セキュリティ強化が必須の課題である。セキュリティ強化方法として生体情報を用いた個人認証が挙げられる。特に、音声による個人認証（話者認識）は利便性が高く有効な個人認証方法の一つであると言える。一方、情報技術の進歩に伴い音声合成が飛躍的に進歩し、実音声と区別がつかない人工音声を生成可能となってきている。本研究では、人工音声による話者認識機器詐称の防止を目的に研究を進める。日本語の人工音声コーパスを作成し、人工音声と実音声の相違点を明確にする。また、人工音声による話者認識器詐称を高精度で防止する対策手法に関して研究を進める。
研究実績の概要	インターネット時代におけるセキュリティ強化として生体情報を用いた個人認証が注目されている。特に、音声による個人認証（話者認識）は利便性が高く有効な個人認証方法の一つであると言える。しかし、音声合成技術の飛躍的な進歩により人工音声による話者認識器詐称が危惧されている。本研究では、人工音声による話者認識機器詐称の対策手法に関し研究を進める。申請期間内に日本語の人工音声コーパスを作成し申請期間終了時に一般公開する。人工音声による話者認識器詐称を対策方法の高精度化を進めるため、人工音声と実音声の相違点を明確にするとともに、人工音声による話者認識器詐称の対策手法に関して、特徴量空間の観点および判別モデルの観点で研究を進め、高精度な詐称防止方法を確立させる。 2021年度までに日本音響学会により構築された「新聞記事読み上げ音声コーパス (JNAS)」を用いた「人工音声コーパス」の構築方法および音声データを確立し、構築したコーパスを用いた人工音声に対するi-vectorを用いた話者認識実験を実施した。実験結果より、人工音声がi-vectorおよび深層学習を用いたResNetを基盤とした話者認識器を高確率で詐称することが可能であることを明確にした。2022年度では、話者認識の前に人工音声と実音声を判別することを検討した。人工音声と実音声の判別には深層学習を用いた。人工音声・実音声の判別には人工音声作成方法が既知の場合には高確率で判別可能であることを明確にしたが、未知の場合にはまだ検討が必要であることが明確になった。人工音声を判別し話者認識の前に棄却することにより、詐称者受理を軽減することも明確になった。2023年度では、新たな人工音声変換手法を導入し、さらなる人工音声音声詐称に関する研究を進めた。
現在までの達成度 (区分)	現在までの達成度 (区分) 4: 遅れている理由 2022年度までに作成した人工音声コーパスの構築に時間がかかり、計画の遅れが生じ、その挽回を現在までにできていないことが遅れの大きな要因である。その遅れは期間内に挽回できず、研究期間の延長を行うことで研究予定を達成する。
今後の研究の推進方策	2023年度で新たな人工音声作成手法を導入し、今までとは異なる作成手法に対する現在まで実施した方法を再検討を行った。2024年度では、さらに現在までに行っているResNetに基づく話者埋め込みを用いた手法を拡張し、シャムネットワーク化することにより、入力される音声の二つを同一話者か否かを判定をするネットワークにし、検証を行う。また、2023年度に実施した深層学習の出力に実音声・人工音声判別と共に話者を識別を組み入れるマルチタスク出力を組み入れ、学習・認識をする方法の評価関数などの再検討を行う予定である。

報告書

(5件)

研究成果
(10件)

すべて 2023 2022 2021 2020 2019

すべて学会発表 (10件) (うち国際学会 6件)

[学会発表] Utterance-style-dependent Speaker Verification by Utilizing Emotions2023
- 著者名/発表者名
  H. Takayama, M. Nishida, S. Tsuge, S. Kuroiwa, M. Nishimura
- 学会等名
  Proceedings of IEEE 12th Global Conference on Consumer Electronics (GCCE)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Cross-Lingual Speaker Identification for Japanese-English Bilinguals2023
- 著者名/発表者名
  R. Sano, M. Nishida, S. Tsuge, S. Kuroiwa, H. Yoshimura
- 学会等名
  Proceedings of IEEE 12th Global Conference on Consumer Electronics (GCCE)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Estimating likelihood ratios for authorship evidence with a deep-learning-based text representation2023
- 著者名/発表者名
  Satoru Tsuge and Shunichi Ishihara
- 学会等名
  the 16 th Biennial Conference of the International Association for Forensic and Legal Linguistics
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Same Speaker Identification with Deep Learning and Application to Text-dependent Speaker Verification2022
- 著者名/発表者名
  Manaka Takamizawa, Satoru Tsuge, Yasuo Horiuchi, Shingo Kuroiwa
- 学会等名
  Proc. KES Human Centered Intelligent Systems 2022
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] 発話スタイル指定型話者照合2022
- 著者名/発表者名
  高山　響，西田昌史，柘植　覚，黒岩眞吾，西村雅史
- 学会等名
  情報処理学会第85回全国大会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 同一話者判定DNNを用いたテキスト依存型話者照合2022
- 著者名/発表者名
  髙見澤真央, 黒岩眞吾, 堀内靖雄, 柘植覚
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実施状況報告書
[学会発表] ResNet/ResNeXtによる深層話者埋め込みの検討2021
- 著者名/発表者名
  鈴木克樹, 堀内靖雄, 柘植覚, 黒岩眞吾
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 単母音発声を対象とした深層話者照合手法の検討2021
- 著者名/発表者名
  髙見澤真央, 黒岩眞吾, 堀内靖雄, 柘植覚
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実施状況報告書
[学会発表] Text-Dependent Closed-Set Two-Speaker Recognition of a Key Phrase Uttered Synchronously by Two Persons2020
- 著者名/発表者名
  Ugawa Toshiyuki、Tsuge Satoru、Horiuchi Yasuo、Kuroiwa Shingo
- 学会等名
  Human Centred Intelligent Systems, 2020
- 関連する報告書
  2020 実施状況報告書
- 国際学会
[学会発表] Artificial Speech Corpus in Japanese for Anti-spoofing Automatic Speaker Recognition2019
- 著者名/発表者名
  Satoru Tsuge and Shingo Kuroiwa
- 学会等名
  IIMSS 2019
- 関連する報告書
  2019 実施状況報告書
- 国際学会

人工音声による話者認識器詐称防止に関する研究

研究代表者

柘植 覚 大同大学, 情報学部, 教授 (00325250)

4,290千円 (直接経費: 3,300千円、間接経費: 990千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[学会発表] Utterance-style-dependent Speaker Verification by Utilizing Emotions2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Cross-Lingual Speaker Identification for Japanese-English Bilinguals2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Estimating likelihood ratios for authorship evidence with a deep-learning-based text representation2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Same Speaker Identification with Deep Learning and Application to Text-dependent Speaker Verification2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 発話スタイル指定型話者照合2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 同一話者判定DNNを用いたテキス ト依存型話者照合2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] ResNet/ResNeXtによる深層話者埋め込みの検討2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 単母音発声を対象とした深層話者 照合手法の検討2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Text-Dependent Closed-Set Two-Speaker Recognition of a Key Phrase Uttered Synchronously by Two Persons2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Artificial Speech Corpus in Japanese for Anti-spoofing Automatic Speaker Recognition2019

著者名/発表者名

学会等名

関連する報告書

柘植覚大同大学, 情報学部, 教授 (00325250)

[学会発表] 同一話者判定DNNを用いたテキスト依存型話者照合2022

[学会発表] 単母音発声を対象とした深層話者照合手法の検討2021