• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声合成法と話者適応技術および編集合成に基づく詐称音声の相対位相情報による検出法

研究課題

研究課題/領域番号 16K12461
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知覚情報処理
研究機関中部大学 (2018)
豊橋技術科学大学 (2016-2017)

研究代表者

中川 聖一  中部大学, 工学部, 教授 (20115893)

研究分担者 王 龍標  長岡技術科学大学, 工学研究科, 准教授 (30510458)
岩橋 政宏  長岡技術科学大学, 工学研究科, 教授 (30251854)
研究期間 (年度) 2016-04-01 – 2019-03-31
研究課題ステータス 完了 (2018年度)
配分額 *注記
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2018年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2016年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード話者照合 / 相対位相情報 / 振幅スペクトラム / 位相スペクトラム / 詐称音声 / 再生音 / spoofed speech challenge / 録音再生音 / なりすまし音声 / 話者認識 / 位相情報の正規化
研究成果の概要

話者照合技術の問題点として、本人の音声を詐称するなりすまし音声がある。なりすまし音声としては、(1)声真似、(2)本人の一部の音声を用いた音声合成、(3)本人の音声への声質変換、(4)本人の音声を録音し再生する録音再生、がある。
本研究では、代表者が発明した相対位相特徴を改善し、上述の(2)(3)(4)によるなりすまし音声を高精度に検出する技術を開発した。改善点は、使用する位相の周波数帯域を高域まで拡大したこと、周波数軸のスケールを最適に伸縮したことであり、これによって、単独特徴パラメータとしては世界最良パラメータとなった。また従来の特徴パラメータと併用することにより更に検出精度が向上した。

研究成果の学術的意義や社会的意義

生体認証技術の一つとして話者照合技術がある。本研究では、各話者が約40秒の声を登録しておけば、4秒程度発声した声で、270人の話者から99.7%の精度で正しく発声した話者を識別する技術を開発した。この技術で声による「鍵」などの多くの応用が実現できる。
一方、声真似や本人の一部の声を用いた音声合成技術や声質変換技術、録音再生技術による、なりすまし音声と本人の音声との区別ができなくなる問題が実用化への妨げとなる。本研究では、このなりすまし音声を高精度に検出する技術を開発した。この技術によって、話者照合技術のセキュリティ分野への応用も可能となった。

報告書

(4件)
  • 2018 実績報告書   研究成果報告書 ( PDF )
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 研究成果

    (15件)

すべて 2019 2018 2017 2016 その他

すべて 国際共同研究 (3件) 雑誌論文 (3件) (うち国際共著 2件、 査読あり 3件、 オープンアクセス 2件) 学会発表 (9件) (うち国際学会 6件)

  • [国際共同研究] Tianjin University(中国)

    • 関連する報告書
      2018 実績報告書
  • [国際共同研究] Tianjin University (天津大学)(China)

    • 関連する報告書
      2017 実施状況報告書
  • [国際共同研究] 天津大学(中国)

    • 関連する報告書
      2016 実施状況報告書
  • [雑誌論文] 最近の音声言語処理研究の動向 -筆者の音声認識、音声翻訳、話者認識の研究を中心として-2019

    • 著者名/発表者名
      中川 聖一
    • 雑誌名

      中部大学工学部紀要

      巻: 54 ページ: 1-14

    • NAID

      120007116371

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Spoofing speech detection using modified relative phase information2017

    • 著者名/発表者名
      L. Wang, S. Nakagawa, Z. Zhang, Y. Yoshida, Y. Kawakami
    • 雑誌名

      IEEE Journal of Selected Topics in Signal Processing

      巻: 11 号: 4 ページ: 660-670

    • DOI

      10.1109/jstsp.2017.2694139

    • 関連する報告書
      2017 実施状況報告書 2016 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Noise robust voice activity detection using joint phase and magnitude based feature enhancement2017

    • 著者名/発表者名
      K. Phapatanaburi, L. Wang, Z. Oo, W. Li, S. Nakagawa, M. Iwahashi
    • 雑誌名

      Journal of Ambient Intelligence and Humanized Computing

      巻: 8 号: 6 ページ: 845-859

    • DOI

      10.1007/s12652-017-0482-8

    • 関連する報告書
      2017 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 音声波形と残差波形からのMFCCと位相情報による話者認識の比較2019

    • 著者名/発表者名
      山本滉己、山本一公、中川聖一
    • 学会等名
      電子情報通信学会、総合全国大会
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 残差波形の相対位相情報の話者認識への有効性の検討2019

    • 著者名/発表者名
      中川聖一、山本滉己、山本一公
    • 学会等名
      電子情報通信学会、音声研究会
    • 関連する報告書
      2018 実績報告書
  • [学会発表] Replay attack detection using magnitude and phase information with attention-based adaptive filters2019

    • 著者名/発表者名
      M. Liu, L. Wang, J. Dang, S. Nakagawa, H. Guan, X. Li
    • 学会等名
      IEEE ICASSP
    • 関連する報告書
      2018 実績報告書
    • 国際学会
  • [学会発表] Multiple phase information combination for replay attacks detection2018

    • 著者名/発表者名
      D. Li, L. Wang, J. Dang, M. Liu, Z. Oo, S. Nakagawa, H. Guan, X. Li
    • 学会等名
      ESCA Interspeech
    • 関連する報告書
      2018 実績報告書
    • 国際学会
  • [学会発表] Replay attacks detection using phase and magnitude features with various frequency resolutions2018

    • 著者名/発表者名
      M. Liu, L. Wang, Z. Oo, J. Dang, D. Li, S. Nakagawa
    • 学会等名
      ISCSLP
    • 関連する報告書
      2018 実績報告書
    • 国際学会
  • [学会発表] Automatic speaker verification for reply attacks using Mel-scale phase and magnitude features2018

    • 著者名/発表者名
      Z. Oo, L. Wang, L. Meng, S. Nakagawa, M. Iwahashi
    • 学会等名
      日本音響学会、春季研究発表会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] Phase aware deep neural network for noise robust voice activity detection2017

    • 著者名/発表者名
      L. Wang, K. Phapatanaburi, Z. Oo, S. Nakagawa, M. Iwahashi, J. Dang
    • 学会等名
      IEEE ICME
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] Pseudo-pitch-syncronized phase information extraction and its application for robust speaker recognition2017

    • 著者名/発表者名
      L. Wang, S. Nakagawa, J. Dang, J. Wei, T. Shen
    • 学会等名
      GCCE
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会
  • [学会発表] DNN-based amplitude and phase feature enhancement for noise robust speaker identification2016

    • 著者名/発表者名
      Z. Oo, Y. Kawakami, L. Wang, S. Nakagawa, X. Xiao, M. Iwahashi
    • 学会等名
      Proc. Interspeech, ISCA
    • 発表場所
      サンフランシスコ、アメリカ
    • 年月日
      2016-09-11
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会

URL: 

公開日: 2016-04-21   更新日: 2022-02-22  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi