研究概要 |
本研究では,携帯電話のような小型機器を入力デバイスとして想定した場合の,公開鍵基盤(PKI)を利用した認証の信頼性を高める方法として,音声による個人認証(話者照合)をPKIと融合する技術についての検討を行う.この技術を確立するためには,話者照合の実用性を高める必要があり,特に,話者照合の耐雑音性を向上させることが重要である.そこで本年度は,単一の音響特徴量のみでなく,他の複数の特徴量を組み合わせることで耐雑音性の向上をはかるマルチストリーム型の話者照合方式についての検討を行った. これまでに,音声に含まれるケプストラム特徴量と基本周波数特徴量を2つのストリームとみなし,マルチストリームHMMを利用して融合した,雑音に頑健な話者照合手法を提案している.そこで,この手法において,想定される種々の雑音環境に対し,最適なストリーム重みと照合閾値を,線形判別分析とAdaboostを利用して自動的に推定する手法の提案を行った. 評価実験は,男性話者36名が一ヶ月ごと5時期に渡って発声した4桁連続数字を用いて行った.白色雑音が様々なSN比で音声に重畳した場合を想定して,ストリーム重みと,閾値の自動推定を行ったところ,提案手法によって人手によって定めた最適値に近い数値が得られることが確認された.具体例な結果としては,「本人棄却率=詐称者受理率」という等誤り率を目標として自動最適化を行った場合に,SN比20dBにおいて本人棄却率3.4%,詐称者受理率3.7%を得た.ケプストラム特徴量のみを用いた場合の等誤り率が4.9%であり,人手によって最適化した場合の等誤り率が3.4%であることから,提案手法によってストリーム重みと閾値の最適化が行われたことがわかった.
|