2018 年度研究成果報告書

音声合成法と話者適応技術および編集合成に基づく詐称音声の相対位相情報による検出法

研究課題

PDF

研究課題/領域番号	16K12461
研究種目	挑戦的萌芽研究
配分区分	基金
研究分野	知覚情報処理
研究機関	中部大学 (2018) 豊橋技術科学大学 (2016-2017)
研究代表者	中川聖一中部大学, 工学部, 教授 (20115893)
研究分担者	王龍標長岡技術科学大学, 工学研究科, 准教授 (30510458) 岩橋政宏長岡技術科学大学, 工学研究科, 教授 (30251854)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	話者照合 / 相対位相情報 / 振幅スペクトラム / 位相スペクトラム / 詐称音声 / 再生音 / spoofed speech challenge
研究成果の概要	話者照合技術の問題点として、本人の音声を詐称するなりすまし音声がある。なりすまし音声としては、(1)声真似、(2)本人の一部の音声を用いた音声合成、(3)本人の音声への声質変換、(4)本人の音声を録音し再生する録音再生、がある。本研究では、代表者が発明した相対位相特徴を改善し、上述の(2)(3)(4)によるなりすまし音声を高精度に検出する技術を開発した。改善点は、使用する位相の周波数帯域を高域まで拡大したこと、周波数軸のスケールを最適に伸縮したことであり、これによって、単独特徴パラメータとしては世界最良パラメータとなった。また従来の特徴パラメータと併用することにより更に検出精度が向上した。
自由記述の分野	知覚情報処理
研究成果の学術的意義や社会的意義	生体認証技術の一つとして話者照合技術がある。本研究では、各話者が約40秒の声を登録しておけば、4秒程度発声した声で、270人の話者から99.7％の精度で正しく発声した話者を識別する技術を開発した。この技術で声による「鍵」などの多くの応用が実現できる。一方、声真似や本人の一部の声を用いた音声合成技術や声質変換技術、録音再生技術による、なりすまし音声と本人の音声との区別ができなくなる問題が実用化への妨げとなる。本研究では、このなりすまし音声を高精度に検出する技術を開発した。この技術によって、話者照合技術のセキュリティ分野への応用も可能となった。