2020 Fiscal Year Annual Research Report
Safe and secure speech information processing based on liveness detection and ASVspoof challenge
Project/Area Number |
18KT0051
|
Research Institution | National Institute of Informatics |
Principal Investigator |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 教授 (70709352)
|
Co-Investigator(Kenkyū-buntansha) |
大木 哲史 静岡大学, 情報学部, 准教授 (80537407)
|
Project Period (FY) |
2018-07-18 – 2021-03-31
|
Keywords | 音声情報処理 / なりすまし / 生体認証 / ASVspoofチャレンジ / 生体検知 |
Outline of Annual Research Achievements |
音声アシスト等の音声情報処理端末が普及するにつれ、要素技術である話者照合や音声認識に対する攻撃が起き始め、 セキュリティ上の課題となっている。本研究の目的は、提案者が成果を挙げて来た生体検知技術を先駆的に導入し、問題の一解決法を提示することである。 生体検知技術とは「他人により許可なく取得され、加工され、外部デバイスにより再生された音声」と「生体からその場で発声した生の音声」を区別する機械学習技術である。提案者はこれまで話者照合の生体検知精度を競うASVSpoof challengeを開催するなど音声の生体検知技術の研究発展に大きく貢献して来た。 2018年度はASVspoof Challenge 2019用のデータベースとして、最先端の音声合成や声質変換技術により生成された様々な合成音声を含む大規模データベースを構築した。これはGoogleをはじめとする著名企業および分野をリードする大学合計17組織が保有する技術により生成された多様な合成音声を含み、音声の生体検知研究用ベンチマークとしては最大である。 2019年度では、本データベースを全世界の大学および企業合計150組織へ配布し、世界的なコンペティションを開催した。参加者は各自の技術により生体検知モデルを構築し、オーガナイザーが生体認証に対するエラーを考慮した上でランキングを行った。その結果、人間には聴覚上差がわからない様な加工音声に対しても、高精度に識別可能であることが判明し、安全安心な音声情報処理端末を実現する上で重要な結果が得られた。そのほか、国際会議Interspeech 2019およびASRU201におけるスペシャルセッションの開催、および、国際ジャーナルCSLにおける特集号も企画した。 2020年度ではより詳細な分析を行い、一連の研究活動を3本のジャーナル論文とてまとめ、国際ジャーナル誌において出版した。
|