音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証

Research Project

Project/Area Number	14780261
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Tokyo Institute of Technology
Principal Investigator	岩野公司東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)
Project Period (FY)	2002 – 2004
Project Status	Completed (Fiscal Year 2004)
Budget Amount *help	¥3,700,000 (Direct Cost: ¥3,700,000) Fiscal Year 2004: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2003: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2002: ¥2,700,000 (Direct Cost: ¥2,700,000)
Keywords	バイオメトリック個人認証 / マルチモーダル個人認証 / 音声 / 耳介画像 / 韻律情報
Research Abstract	本研究では,「音声と耳介画像を用いた頑健なマルチモーダル個人認証システム」を提案している.提案システムでは,音声と耳介画像の特徴量を別個に申請者の音声モデル・耳介画像モデルに入力し,得られる二つの尤度を重み付けして足し合わせて融合スコアを求め,そのスコアが閾値を超えれば本人,超えなければ詐称者と判断する.昨年度までに,耳介画像の特徴量の改善による個人認証システムの頑健性向上を行った.本年度は,音声情報による個人認証(話者照合)の耐雑音性の向上を行うことで,システム全体の性能改善をはかる. そこで,これまで利用してきた話者の声道の伝達特性を反映するケプストラム情報(MFCC)とあわせて,話者の声の高さやイントネーションなどの韻律情報を反映する基本周波数情報(F_0)を音声特徴量として利用した.基本周波数の抽出には,ハフ変換を利用した雑音に頑健な手法を用い,得られたlogF_0とΔlogF_0を特徴量として組み込んだ.約半年に渡る5時期分の個人認証用データベース(男性38名)を用い,評価用の音声データにさまざまなSNR条件で白色雑音を重畳させて認証実験を行ったところ,すべてのSNRにおいて韻律情報を加えたことによるシステムの性能改善が確認された.韻律情報の融合による改善が最も大きかったのはSNRが10dB付近で,音声のみの認証(話者照合)の性能としては約40%,マルチモーダル個人認証の性能としては約30%,等誤り率が削減された. また,スコア融合の際に用いる重みの最適化法についても検討を行った。ケプストラム情報と基本周波数情報の融合に用いる重みについては,ブースティングに基づく重み最適化手法の提案を行い,雑音環境下における話者照合実験によって有効性を確認した.今後は,本手法を音声と耳介情報の融合時の重み最適化に適用することを検討する.

Report

(3 results)

Research Products

(9 results)

All 2005 2004 Other

All Journal Article (6 results) Publications (3 results)

[Journal Article] Multimodal speaker verification using ear image feature extracted by PCA and ICA2005
- Author(s)
  Koji Iwano, Taro Miyazaki, Sadaoki Furui
- Journal Title
  
  Audio- and video-based biometric person authentication, Springer Verlag (発表予定)
- Related Report
  2004 Annual Research Report
[Journal Article] 雑音に頑健な話者照合のための基本周波数情報の利用2004
- Author(s)
  浅見太一, 岩野公司, 古井貞煕
- Journal Title
  
  電子情報通信学会技術研究報告 104・87
  
  Pages: 1-6
- NAID
  110003295898
- Related Report
  2004 Annual Research Report
[Journal Article] 音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化2004
- Author(s)
  宮崎太郎, 浅見太一, 岩野公司, 古井貞煕
- Journal Title
  
  日本音響学会秋季研究発表会講演論文集 1
  
  Pages: 99-100
- NAID
  120007016581
- Related Report
  2004 Annual Research Report
[Journal Article] マルチストリーム話者照合のためのブースティングによる重み最適化2004
- Author(s)
  浅見太一, 岩野公司, 古井貞煕
- Journal Title
  
  日本音響学会秋季研究発表会講演論文集 1
  
  Pages: 101-102
- NAID
  120007016582
- Related Report
  2004 Annual Research Report
[Journal Article] Noise-robust speaker verification using F_0 features2004
- Author(s)
  Koji Iwano, Taichi Asami, Sadaoki Furui
- Journal Title
  
  Proceedings of 8th International Conference on Spoken Language Processing 2
  
  Pages: 1417-1420
- Related Report
  2004 Annual Research Report
[Journal Article] マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討2004
- Author(s)
  浅見太一, 岩野公司, 古井貞煕
- Journal Title
  
  電子情報通信学会技術研究報告 104・542
  
  Pages: 85-90
- NAID
  110003278807
- Related Report
  2004 Annual Research Report
[Publications] 岩野公司, 広瀬智治, 上林英悟, 古井貞煕: "音声と耳介画像を用いたマルチモーダル話者照合"目本音響学会春季研究発表会講演論文集. 1. 109-110 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 岩野公司, 広瀬智治, 上林英悟, 古井貞煕: "音声と耳介画像を用いたマルチモーダル個人認証"電子情報通信学会技術研究報告. 103・94. 25-30 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Koji Iwano, Tomoharu Hirose, Eigo Kamibayashi, Sadaoki Furui: "Audio-visual person authentication using speech and ear images"Proceedings of Workshop on Multimodal User Authentication. 85-90 (2003)
- Related Report
  2003 Annual Research Report

音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証

Principal Investigator

岩野 公司 東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)

¥3,700,000 (Direct Cost: ¥3,700,000)

Report

Research Products

[Journal Article] Multimodal speaker verification using ear image feature extracted by PCA and ICA2005

Author(s)

Journal Title

Related Report

[Journal Article] 雑音に頑健な話者照合のための基本周波数情報の利用2004

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化2004

Author(s)

Journal Title

NAID

Related Report

[Journal Article] マルチストリーム話者照合のためのブースティングによる重み最適化2004

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Noise-robust speaker verification using F_0 features2004

Author(s)

Journal Title

Related Report

[Journal Article] マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討2004

Author(s)

Journal Title

NAID

Related Report

[Publications] 岩野公司, 広瀬智治, 上林英悟, 古井貞煕: "音声と耳介画像を用いたマルチモーダル話者照合"目本音響学会春季研究発表会講演論文集. 1. 109-110 (2003)

Related Report

[Publications] 岩野公司, 広瀬智治, 上林英悟, 古井貞煕: "音声と耳介画像を用いたマルチモーダル個人認証"電子情報通信学会技術研究報告. 103・94. 25-30 (2003)

Related Report

[Publications] Koji Iwano, Tomoharu Hirose, Eigo Kamibayashi, Sadaoki Furui: "Audio-visual person authentication using speech and ear images"Proceedings of Workshop on Multimodal User Authentication. 85-90 (2003)

Related Report

岩野公司東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)