2018 Fiscal Year Research-status Report
生体検知とASVspoofチャレンジによる安全・安心な音声情報処理システムの実現
Project/Area Number |
18KT0051
|
Research Institution | National Institute of Informatics |
Principal Investigator |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)
|
Co-Investigator(Kenkyū-buntansha) |
大木 哲史 静岡大学, 情報学部, 講師 (80537407)
|
Project Period (FY) |
2018-07-18 – 2021-03-31
|
Keywords | 音声情報処理 / なりすまし / 生体認証 / ASVspoofチャレンジ / 生体検知 |
Outline of Annual Research Achievements |
音声アシスト等の音声情報処理端末が爆発的に普及するにつれ、要素技術である話者照合や音声認識に対する攻撃が起き始め、 セキュリティ上の課題となっている。本研究の目的は、提案者が成果を挙げて来た生体検知技術を、話者照合そして音声認識にも先駆的に導入し、問題の一解決法を提示する。 生体検知技術とは「他人により許可なく取得され、加工され、外部デバイス により再生された音声」と「生体からその場で発声した生の音声」を区別する機械学習技術である。
本年度は音声生体検知技術の精度を更に向上させた。提案者は話者照合の生体検知精度を競うASVSpoof challengeを開催するなど音声の生体検知技術の研究発展に大きく貢献して来た。2018年度はASVspoof Challenge 2019を開始し、ASVspoof Challenge 2019用のデータベースとして、最先端の音声合成や声質変換技術により生成された様々な合成音声を含む大規模データベースを新たに構築した。
これはGoogleをはじめとする著名企業および分野をリードする大学合計17組織が保有する技術により生成された多様な合成音声を含み、音声の生体検知研究用ベンチマークとしては最大である。この様な合成音声が人間に提示される方法は、電話等を通して直接提示されるlogical accessとスピーカ等により再生され、提示されるphysical accessの2種類がある。そこでASVspoof Challenge 2019では、この2種類の提示方法を考慮し、個別に評価を行った。本データベースは、既に全世界の大学および企業合計140組織へ配布され、参加者はより頑健な生体検知モデルを構築、より高精度な識別を実現した。本チャレンジはオーストリアで開催される国際会議Interspeech 2019のスペシャルセッションとして開催される予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
Google等の国際企業と連携し、大規模な音声の生体検知研究用ベンチマークを構築できたこと、また、全世界の大学および企業合計140以上の組織が利用したいと意思表明したことは当初の計画を上回る成果であり、研究の重要性・波及効果を顕著に示している。
|
Strategy for Future Research Activity |
近年の攻撃対象は、話者照合だけでなく、更に音声認識、音声インタフェース一般に拡大していることから、scattering変換など生体検知に有効と判明した技術を音声認識へも応用し、音声認識の生体検知を提案する予定である。その際、生体検知手法の高精度化と同時に、異常値検出法の検討も行い、予想が難しい攻撃に備えることを目指す。
また、近年多くの攻撃手法が提案され、早急な対応が求められているadversarial examplesについても検討を行う。音声のadversarial examplesの生成に成功したという報告が数件あることから、これらについて対応を検討することは急務である。
|
Causes of Carryover |
予定していた国内出張の開催日が次年度以降となったため少額の差額11,991円が発生したが、ほぼ当初の計画通り予算執行した。次年度に本差額を国内出張にて執行する予定である。
|
Research Products
(11 results)