• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

生体検知とASVspoofチャレンジによる安全・安心な音声情報処理システムの実現

Research Project

Project/Area Number 18KT0051
Research InstitutionNational Institute of Informatics

Principal Investigator

山岸 順一  国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)

Co-Investigator(Kenkyū-buntansha) 大木 哲史  静岡大学, 情報学部, 講師 (80537407)
Project Period (FY) 2018-07-18 – 2021-03-31
Keywords音声情報処理 / なりすまし / 生体認証 / ASVspoofチャレンジ / 生体検知
Outline of Annual Research Achievements

音声アシスト等の音声情報処理端末が爆発的に普及するにつれ、要素技術である話者照合や音声認識に対する攻撃が起き始め、 セキュリティ上の課題となっている。本研究の目的は、提案者が成果を挙げて来た生体検知技術を、話者照合そして音声認識にも先駆的に導入し、問題の一解決法を提示することである。 生体検知技術とは「他人により許可なく取得され、加工され、外部デバイスにより再生された音声」と「生体からその場で発声した生の音声」を区別する機械学習技術である。

提案者はこれまで話者照合の生体検知精度を競うASVSpoof challengeを開催するなど音声の生体検知技術の研究発展に大きく貢献して来た。2018年度はASVspoof Challenge 2019用のデータベースとして、最先端の音声合成や声質変換技術により生成された様々な合成音声を含む大規模データベースを構築した。これはGoogleをはじめとする著名企業および分野をリードする大学合計17組織が保有する技術により生成された多様な合成音声を含み、音声の生体検知研究用ベ ンチマークとしては最大である。

2019年度では、本データベースを全世界の大学および企業合計150組織へ配布し、世界的なコンペティションを開催した。参加者は各自の技術により生体検知モデルを構築し、オーガナイザーが生体認証に対するエラーを考慮した上でランキングを行った。その結果、人間には聴覚上差がわからない様な加工音声に対しても、高精度に識別可能であることが判明し、安全安心な音声情報処理端末を実現する上で重要な結果が得られた。そのほか、国際会議Interspeech 2019およびASRU201におけるのスペシャルセッションの開催、および、国際ジャーナルCSLにおける特集号も企画した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

チャレンジで構築された大規模データベースは無償で研究および商用に供されて国内外企業に広く利用され、音声による個人認証(話者認識)の安全性や安心感を著しく高めることに貢献した。協力企業Googleおよびチャレンジ優勝企業ID R&D Inc.によるプレスリリースに加え、米国を中心に世界でForbes紙など多数(70件以上)の新聞報道があった。

Strategy for Future Research Activity

これまでの研究では、生体検知単体の精度向上を検討してきた。しかし、実際には、生体認証と生体検知の両方を同時に用いることから、これらの統合した際の性能を向上し、精度向上を図るべきである。そこで強化学習を導入し、これらの統合技術を検討する。

また、近年の攻撃対象は、話者照合だけでなく、更に音声認識、音声インタフェース一般に拡大している。その一例は、近年多くの攻撃手法が提案され、早急な対応が求められているadversarial examplesである。音声のadversarial examplesの生成に成功したという報告が数件あることから、これらについて対応を検討することは急務である。本年度は、音声のadversarial examplesの検出方法の検討を行う。

  • Research Products

    (14 results)

All 2020 2019 Other

All Int'l Joint Research (4 results) Journal Article (4 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 4 results,  Open Access: 4 results) Presentation (5 results) (of which Int'l Joint Research: 1 results,  Invited: 3 results) Remarks (1 results)

  • [Int'l Joint Research] Eurecom/INRIA(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      Eurecom/INRIA
  • [Int'l Joint Research] University of East Finland(フィンランド)

    • Country Name
      FINLAND
    • Counterpart Institution
      University of East Finland
  • [Int'l Joint Research] University of Edinburgh(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      University of Edinburgh
  • [Int'l Joint Research] Johns Hopkins University(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      Johns Hopkins University
  • [Journal Article] An initial investigation on optimizing tandem speaker verification and countermeasure systems using reinforcement learning2020

    • Author(s)
      Anssi Kanervisto, Ville Hautamaki, Tomi Kinnunen, Junichi Yamagishi
    • Journal Title

      Proc. Odyssey 2020 The Speaker and Language Recognition Workshop

      Volume: - Pages: 1-8

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Attentive Filtering Networks for Audio Replay Attack Detection2019

    • Author(s)
      C. Lai, A. Abad, K. Richmond, J. Yamagishi, N. Dehak and S. King
    • Journal Title

      Proc. 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

      Volume: - Pages: 6316-6320

    • DOI

      https://doi.org/10.1109/ICASSP.2019.8682640

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] ASVspoof 2019: Future Horizons in Spoofed and Fake Audio Detection2019

    • Author(s)
      Massimiliano Todisco, Xin Wang, Ville Vestman, Md. Sahidullah, Hector Delgado, Andreas Nautsch, Junichi Yamagishi, Nicholas Evans, Tomi H. Kinnunen, Kong Aik Lee
    • Journal Title

      Proc. Interspeech 2019

      Volume: - Pages: 1008-1012

    • DOI

      http://dx.doi.org/10.21437/Interspeech.2019-2249

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Efficient Spoofing Attack Detection against Unknown Sample using End-to-End Anomaly Detection2019

    • Author(s)
      Ohki Tetsushi、Gupta Vishu、Nishigaki Masakatsu
    • Journal Title

      2019 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)

      Volume: - Pages: 224-230

    • DOI

      https://doi.org/10.1109/APSIPAASC47483.2019.9023183

    • Peer Reviewed / Open Access
  • [Presentation] 生体認証を回避する物理的なAdversarial Exampleの検討2020

    • Author(s)
      Vo Ngoc Khoi Nguyen, 西垣正勝, 大木哲史
    • Organizer
      第82回情報処理学会全国大会
  • [Presentation] スマートフォンのタップ音からの入力内容推測可能性に関する研究2020

    • Author(s)
      大内結雲, 奥寺瞭介, 塩見裕哉, 上原航汰, 杉本彩歌, 大木哲史, 西垣正勝
    • Organizer
      暗号と情報セキュリティシンポジウム2020,
  • [Presentation] 話者照合の生体検知チャレンジ「ASVspoof 2019」の概要と今後の展望2019

    • Author(s)
      山岸順一
    • Organizer
      第9回バイオメトリクスと認識・認証シンポジウム
    • Invited
  • [Presentation] フェイク動画問題: メディア解析技術によるアプローチ2019

    • Author(s)
      山岸 順一
    • Organizer
      JST/CRDS 公開ワークショップ 「意思決定のための情報科学 ~情報氾濫・フェイク・分断に立ち向かうことは可能か~」 2019年7月25日
    • Invited
  • [Presentation] Speaker Identity Cloning and Protection2019

    • Author(s)
      Junichi Yamagishi
    • Organizer
      AFEKA SPEECH PROCESSING CONFERENCE 2019: 10-YEAR ANNIVERSARY CONFERENCE
    • Int'l Joint Research / Invited
  • [Remarks] ASVspoof website

    • URL

      https://www.asvspoof.org

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi