2002 Fiscal Year Annual Research Report
音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証
Project/Area Number |
14780261
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
岩野 公司 東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)
|
Keywords | バイオメトリック個人認証 / マルチモーダル個人認証 / 音声 / 耳介画像 |
Research Abstract |
高精度で頑健な個人認証技術の開発を目的として,音声と耳介画像を用いたマルチモーダル個人認証手法を提案し,その雑音環境下での認証性能の評価を行った.提案手法は,音声と耳介画像の特徴量を別個に申請者の音声モデル・耳介画像モデルに入力し,それぞれの尤度を算出する.これら二つの尤度を重み付けして足し合わせることで融合スコアを求め,そのスコアが閾値を超えれば本人,超えなければ詐称者であると判断する.申請者の音声モデルはHMM,耳介画像モデルはGMMで構築した.音声特徴量には12次元のMFCCとそれらの一次微分係数,およびΔ対数パワーの計25次元ベクトルを,耳介画像特徴量には学習データの主成分分析で得られた17次元の「固有耳」空間への射影によって得られる主成分得点を用いた. 特徴量の経年変化を考慮し,約半年に渡る5時期分の音声・耳介画像データベースを作成し,提案手法の性能評価を行った.データベースは男性38名のデータで構成されており,各話者について一時期あたり50個の4桁数字読み上げ音声と一枚の右耳正面画像が収録されている.1〜3時期目のデータを学習データ,4,5時期目のデータを評価データとし,学習音声データにSN比30dBの白色雑音,評価音声データにSN比5,15,20,30dBの白色雑音を重畳した. 実験の結果,すべての雑音条件において,音声のみ,耳介画像のみを用いた認証より,提案手法の方が高い認証性能を示した.特にSN比が15dBの時に融合による効果が大きく,音声のみによる認証誤り率(14.2%),耳介画像のみによる認証誤り率(15.8%)から,相対的に40〜50%誤り率が削減され,提案手法の誤り率は8.2%となった.なお,提案手法の最高性能はSN比30dBにおける誤り率0.4%であった.
|