2019 Fiscal Year Research-status Report
生体検知とASVspoofチャレンジによる安全・安心な音声情報処理システムの実現
Project/Area Number |
18KT0051
|
Research Institution | National Institute of Informatics |
Principal Investigator |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)
|
Co-Investigator(Kenkyū-buntansha) |
大木 哲史 静岡大学, 情報学部, 講師 (80537407)
|
Project Period (FY) |
2018-07-18 – 2021-03-31
|
Keywords | 音声情報処理 / なりすまし / 生体認証 / ASVspoofチャレンジ / 生体検知 |
Outline of Annual Research Achievements |
音声アシスト等の音声情報処理端末が爆発的に普及するにつれ、要素技術である話者照合や音声認識に対する攻撃が起き始め、 セキュリティ上の課題となっている。本研究の目的は、提案者が成果を挙げて来た生体検知技術を、話者照合そして音声認識にも先駆的に導入し、問題の一解決法を提示することである。 生体検知技術とは「他人により許可なく取得され、加工され、外部デバイスにより再生された音声」と「生体からその場で発声した生の音声」を区別する機械学習技術である。
提案者はこれまで話者照合の生体検知精度を競うASVSpoof challengeを開催するなど音声の生体検知技術の研究発展に大きく貢献して来た。2018年度はASVspoof Challenge 2019用のデータベースとして、最先端の音声合成や声質変換技術により生成された様々な合成音声を含む大規模データベースを構築した。これはGoogleをはじめとする著名企業および分野をリードする大学合計17組織が保有する技術により生成された多様な合成音声を含み、音声の生体検知研究用ベ ンチマークとしては最大である。
2019年度では、本データベースを全世界の大学および企業合計150組織へ配布し、世界的なコンペティションを開催した。参加者は各自の技術により生体検知モデルを構築し、オーガナイザーが生体認証に対するエラーを考慮した上でランキングを行った。その結果、人間には聴覚上差がわからない様な加工音声に対しても、高精度に識別可能であることが判明し、安全安心な音声情報処理端末を実現する上で重要な結果が得られた。そのほか、国際会議Interspeech 2019およびASRU201におけるのスペシャルセッションの開催、および、国際ジャーナルCSLにおける特集号も企画した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
チャレンジで構築された大規模データベースは無償で研究および商用に供されて国内外企業に広く利用され、音声による個人認証(話者認識)の安全性や安心感を著しく高めることに貢献した。協力企業Googleおよびチャレンジ優勝企業ID R&D Inc.によるプレスリリースに加え、米国を中心に世界でForbes紙など多数(70件以上)の新聞報道があった。
|
Strategy for Future Research Activity |
これまでの研究では、生体検知単体の精度向上を検討してきた。しかし、実際には、生体認証と生体検知の両方を同時に用いることから、これらの統合した際の性能を向上し、精度向上を図るべきである。そこで強化学習を導入し、これらの統合技術を検討する。
また、近年の攻撃対象は、話者照合だけでなく、更に音声認識、音声インタフェース一般に拡大している。その一例は、近年多くの攻撃手法が提案され、早急な対応が求められているadversarial examplesである。音声のadversarial examplesの生成に成功したという報告が数件あることから、これらについて対応を検討することは急務である。本年度は、音声のadversarial examplesの検出方法の検討を行う。
|
Research Products
(14 results)