2014 Fiscal Year Annual Research Report
声の生体検知を用いたセキュアな話者照合システムの実現
Project/Area Number |
26280066
|
Research Institution | National Institute of Informatics |
Principal Investigator |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)
|
Co-Investigator(Kenkyū-buntansha) |
松井 知子 統計数理研究所, モデリング研究系, 教授 (10370090)
越前 功 国立情報学研究所, コンテンツ科学研究系, 教授 (30462188)
小野 順貴 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)
塩田 さやか 首都大学東京, システムデザイン研究科, 助教 (90705039)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 人間情報学 / 知覚情報処理 / 音声情報処理 / 話者照合 / 音声合成 |
Outline of Annual Research Achievements |
本研究では、「声の生体検知」メカニズムの先駆的導入によるセキュアな話者認証システムの構築を目的とする。現在、話者認証システムの市場導入が進む一方で、音声合成および声質変換技術の高度化による声の詐称が可能となりつつあり、実運用上の重要な課題となっている。我々は、この問題に対し「声の生体検知」メカニズムの確立を目指す。平成26年度は、計画通り、詐称者コーパスの構築、 Voice Anti-spoofing Challengeの実施、ポップノイズを利用した声の生体検知の研究を行った。 (1)種々の音声合成方式、声質変換方式等を利用して詐称者コーパスを構築した。100名の目標話者それぞれに対し、10種類ほどの詐称者サンプルを用意し、合計約千時間に相当する大規模詐称者コーパスを作成し、SASコーパスと名称した。 (2)音声技術の国際会議Interspeech 2015のスペシャルセッションとして、EC FP7プロジェクトTABULA RASAのメンバーおよび話者認識ワークショップOdyssey 2014のオーガナイザーと共に、Voice Anti-spoofing Challenge (http://www.spoofingchallenge.org) を実施した。 (3)これまでの声の詐称検出方法は音声信号における自然音声と合成音声の違いの差を見つけ出すことに主眼を置いていた。しかし、声の詐称を見抜くためには差に着目するのではなく、抜本的な解決法が必要である。そこで、入力音声が人間の口から実際に発声されているかどうかを判断する声の生体検知法という方法論を考え、スピーカーやロボットの口などの音声再生装置からは起こりえないが、人間の発声においては必ず起こる現象を捉えることを考えた。平成26年度では、マイクに息がかかるノイズ音(ポップノイズ)を意図的に検出する生体検知法について検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本研究にて構築された声の詐称者コーパスは、前述のVoice Anti-spoofing Challengeで利用された。Voice Anti-spoofing Challengeでは、当初の計画を大幅に上回る全世界30以上の大学・研究組織・企業からエントリーがあり、また国際学会のスペシャルセッションには15編以上の論文投稿があった。この様に、本事業が、声の詐称検出という課題を学術・ 研究分野として認知、確立させたとともに、先導的役割を果たすことがでできたことの意義・成果は大変大きい。早くも第二回目のVoice Anti-spoofing Challengeの企画・検討が始まり、当初の計画以上の影響力も継続して発信している。この様に学術・ 研究分野として認知されることにより、多くの研究者が本課題に取り組み、そのことにより研究が加速され、より多くの研究成果が達成されると考えられる。 また、生体音声と再生音声にある明確な違いとして、マイクに息がかかるノイズ音「ポップノイズ」の有無に着目し、ポップノイズの有無により音声が生体から発声されたものなのかスピーカー等で再生されたものなのかを判定することで、なりすまし攻撃を避ける方法について詳細な検討を行った。そして、提案ポップノイズ検出による生体検知により、生体情報が非常に高精度に検知出来ることを確認した。これにより現在よりもよりセキュアな話者認証システムを容易に構築することが可能になる。今後ポップノイズ以外の生体検知手法を導入することで、当初の計画以上にセキュアで安心な話者照合システムが実現できると期待される。
|
Strategy for Future Research Activity |
平成27年度も、計画通り研究を進める。実施計画は以下の通りである。 (1)声の生体検知手法として、口の放射特性を計測することも考えられる。口の開口面積は発話する音韻と共に動的に変化するため、その放射特性もまた動的に変化すると考えられる。これをマイクロホンアレイ等を用いて検出することにより、生体の口のように、放射特性が動的に変動する発音体であるのか、スピーカーのように放射特性が静的な発音体であるのかを識別することを検討する。この他、スピーカーの再生限界を超えた周波数特徴量の検出や接触型マイクによる心拍等の生体信号検出も検討する。 (2)ポップノイズ手法を含む提案生体検知手法を、既存の話者認証系への導入し、話者照合法の頑健性を向上する。GMMを用いた標準的な話者認証システムを、音声合成もしくは声質変換用いることで詐称可能であることは数多くの文献で報告されている。 さらには SVM や i-Vector といった最先端の話者照合システムも詐称可能であることも報告されている。そこで、これらの従来システムに声の生体検知を導入し、その有効性を詳細に確かめる。 (3)話者認証の分野で大変好評であったVoice Anti-spoofing Challengeの二回目の企画および準備を進める。より高性能な詐称サンプルの収集や、テキスト依存型話者照合システムでの検証等取り組む課題は多い。
|
Causes of Carryover |
研究分担者が参加を予定していた国際会議が3月ではなく4月開催になったため、旅費を次会計年度へ繰り越すものとした。
またプレイバックデータの収集を企業へ発注したが、企業の都合により納期がおくれた関係上、支払いが次会計年度になり、平成27年度へ繰り越すものとした。
|
Expenditure Plan for Carryover Budget |
4月開催になった国際会議に関しては、出張・参加し、費用を計上する。
またプレイバックデータの収集を依頼した企業への支払いも、平成27年度に行われる予定である。
|
Remarks |
2015年4月28日 日本経済新聞電子版および朝刊15面 「音声合成技術に脚光」 息を利用して合成音声と自然音声を区別する技術が紹介されました。 日刊工業新聞 2/18 朝刊19面 「光と影に対応」音声合成により本人似た声を実現する技術と、合成音声と自然音声を区別する技術の両方を同時に研究していることが、日刊工業新聞に紹介されました。
|
Research Products
(10 results)