• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実績報告書

音声合成法と話者適応技術および編集合成に基づく詐称音声の相対位相情報による検出法

研究課題

研究課題/領域番号 16K12461
研究機関中部大学

研究代表者

中川 聖一  中部大学, 工学部, 教授 (20115893)

研究分担者 王 龍標  長岡技術科学大学, 工学研究科, 准教授 (30510458) [辞退]
岩橋 政宏  長岡技術科学大学, 工学研究科, 教授 (30251854)
研究期間 (年度) 2016-04-01 – 2019-03-31
キーワード話者照合 / 詐称音声 / 録音再生音 / なりすまし音声 / 相対位相情報 / 話者認識
研究実績の概要

ユーザの生体情報によるセキュリティ手段の一つである話者照合技術に関して、悪意をもってユーザになり済ます録音再生音による詐称音声を検出するために、ユーザが直接マイクに発声した音声と人の声を録音再生した音声との弁別を行う手法に関して検討した。今年度は、以前から我々が提案してきた相対位相情報に基づく話者照合法を改善し、周波数帯域による話者情報の偏在性に着目し、頑健に弁別しやすくなるように周波数軸スケールの伸縮を行い、フィルタバンクの形状を自動学習する方法の検討を行った。同様の手法を振幅スペクトラムについても行い、代表的な特徴パラメータとの比較を行った。その結果、提案した周波数軸の適応的伸縮による相対位相情報が単一の特徴パラメータとしては、世界最高水準の特徴パラメータであることを示した。
また、話者照合の基本技術の開発を検討し、音声の原波形と線形予測分析による残差波形に対して、メル周波数ケプストラム係数(MFCC)と群遅延ケプストラム係数、相対位相情報を抽出し、これらのパラメータの併用による話者照合の改善を行った。相対位相に対しては、使用する周波数帯域を低域から中域までの60Hz~2800Hzまで拡大した。その結果、原波形から抽出した特徴パラメータが残差波形から抽出した特徴パラメータよりも良かったが、残差波形にも多くの話者情報が保存されることが分かった。男性135名、女性135名、合計270名の話者認識において、話者情報の登録に5発話の約20秒間の音声を用いた場合と10発話の約40秒間の音声を用いた場合で、1発話ごとによる話者認識で、それぞれ約99.2%と99.7%の認識率を得ることができた。いずれの場合も相対位相情報が振幅スペクトラム情報の補完情報として有用であることを実証した。

  • 研究成果

    (7件)

すべて 2019 2018 その他

すべて 国際共同研究 (1件) 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (5件) (うち国際学会 3件)

  • [国際共同研究] Tianjin University(中国)

    • 国名
      中国
    • 外国機関名
      Tianjin University
  • [雑誌論文] 最近の音声言語処理研究の動向 -筆者の音声認識、音声翻訳、話者認識の研究を中心として-2019

    • 著者名/発表者名
      中川 聖一
    • 雑誌名

      中部大学工学部紀要

      巻: 54 ページ: 1,14

    • 査読あり / オープンアクセス
  • [学会発表] 音声波形と残差波形からのMFCCと位相情報による話者認識の比較2019

    • 著者名/発表者名
      山本滉己、山本一公、中川聖一
    • 学会等名
      電子情報通信学会、総合全国大会
  • [学会発表] 残差波形の相対位相情報の話者認識への有効性の検討2019

    • 著者名/発表者名
      中川聖一、山本滉己、山本一公
    • 学会等名
      電子情報通信学会、音声研究会
  • [学会発表] Replay attack detection using magnitude and phase information with attention-based adaptive filters2019

    • 著者名/発表者名
      M. Liu, L. Wang, J. Dang, S. Nakagawa, H. Guan, X. Li
    • 学会等名
      IEEE ICASSP
    • 国際学会
  • [学会発表] Multiple phase information combination for replay attacks detection2018

    • 著者名/発表者名
      D. Li, L. Wang, J. Dang, M. Liu, Z. Oo, S. Nakagawa, H. Guan, X. Li
    • 学会等名
      ESCA Interspeech
    • 国際学会
  • [学会発表] Replay attacks detection using phase and magnitude features with various frequency resolutions2018

    • 著者名/発表者名
      M. Liu, L. Wang, Z. Oo, J. Dang, D. Li, S. Nakagawa
    • 学会等名
      ISCSLP
    • 国際学会

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi