2018 Fiscal Year Annual Research Report
Corpus development considering pop-noise balance for robust speaker verification systems
Project/Area Number |
16K16088
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
塩田 さやか 首都大学東京, システムデザイン研究科, 助教 (90705039)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 音声信号処理 / 話者認識 / 話者照合 / 声の生体検知 / なりすまし検出 / ポップノイズ検出 / 音素リスト |
Outline of Annual Research Achievements |
本研究は、声を用いた声の生体認証法である話者照合の安全性を向上するための枠組みである「声の生体検知」に関する改善に関する提案を行っている。声の生体検知において最も重要な役割は入力音声が登録話者の音声を再生してセキュリティを破るなりすまし攻撃を防ぐことにある。そのために,人間が発話する際に自然と行う行為として呼気が発声の中に含まれているかを検知することが大きな目的となる。これまでに行われた研究において、発声の途中で呼気が過剰に含まれる場合に収録される音声にはポップノイズというマイク内部で発生するノイズを検出することで非常に高い精度で人間の発声か機械による再生音声なのかを検出することを達成した。しかし、ポップノイズの有無だけの判定は攻撃者が判定方法さえ知ってしまえば破られてしまう簡単な手法であった。そこで本研究ではさらにポップノイズが発生しやすいまたは発生しにくい音素情報について着目し、プロンプト文を設計することで発声する際に必然的に発生してしまうポップノイズの箇所と発生しにくい箇所を設定することを行った。二年目の成果としては、音素情報を用いたポップノイズ検出に必要となる音素リストの作成方法について検討した。一つ目の手法として話者毎にポップノイズを発生させやすい音素が異なることに着目した話者依存リストを検討した。次にスマートスピーカーや音声対話アシスタントの起動に用いられるフレーズが固定かつ非常に短いことからテキスト依存リストについて検討した。さらに、話者及びテキスト依存リストについても検討を行った。これらのリストを用いて声の生体検知の実験及び話者照合での実験を行ったところ、従来法と比較して提案した音素リストを用いた手法は声の生体検知および話者照合の精度を向上させることを確認した。
|