研究課題
音声アシスト等の音声情報処理端末が普及するにつれ、要素技術である話者照合や音声認識に対する攻撃が起き始め、 セキュリティ上の課題となっている。本研究の目的は、提案者が成果を挙げて来た生体検知技術を先駆的に導入し、問題の一解決法を提示することである。 生体検知技術とは「他人により許可なく取得され、加工され、外部デバイスにより再生された音声」と「生体からその場で発声した生の音声」を区別する機械学習技術である。提案者はこれまで話者照合の生体検知精度を競うASVSpoof challengeを開催するなど音声の生体検知技術の研究発展に大きく貢献して来た。2018年度はASVspoof Challenge 2019用のデータベースとして、最先端の音声合成や声質変換技術により生成された様々な合成音声を含む大規模データベースを構築した。これはGoogleをはじめとする著名企業および分野をリードする大学合計17組織が保有する技術により生成された多様な合成音声を含み、音声の生体検知研究用ベンチマークとしては最大である。2019年度では、本データベースを全世界の大学および企業合計150組織へ配布し、世界的なコンペティションを開催した。参加者は各自の技術により生体検知モデルを構築し、オーガナイザーが生体認証に対するエラーを考慮した上でランキングを行った。その結果、人間には聴覚上差がわからない様な加工音声に対しても、高精度に識別可能であることが判明し、安全安心な音声情報処理端末を実現する上で重要な結果が得られた。そのほか、国際会議Interspeech 2019およびASRU201におけるスペシャルセッションの開催、および、国際ジャーナルCSLにおける特集号も企画した。2020年度ではより詳細な分析を行い、一連の研究活動を3本のジャーナル論文とてまとめ、国際ジャーナル誌において出版した。
すべて 2021 2020 その他
すべて 国際共同研究 (6件) 雑誌論文 (5件) (うち国際共著 4件、 査読あり 5件、 オープンアクセス 5件) 学会発表 (3件) (うち招待講演 1件) 備考 (1件)
IEEE Transactions on Biometrics, Behavior, and Identity Science
巻: 3 ページ: 252~265
10.1109/TBIOM.2021.3059479
Computer Speech & Language
巻: 64 ページ: 101114~101114
10.1016/j.csl.2020.101114
IEEE/ACM Transactions on Audio, Speech, and Language Processing
巻: 28 ページ: 2195~2210
10.1109/taslp.2020.3009494
ISCA The Speaker and Language Recognition Workshop Odyssey 2020
巻: - ページ: 151~158
10.21437/Odyssey.2020-22
2020 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
巻: - ページ: 1425-1429
https://www.asvspoof.org