Project/Area Number |
11750311
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
情報通信工学
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
益子 貴史 東京工業大学, 大学院・総合理工学研究科, 助手 (90272715)
|
Project Period (FY) |
1999 – 2000
|
Project Status |
Completed (Fiscal Year 2000)
|
Budget Amount *help |
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2000: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 1999: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | 話者照合 / 安全性 / 音声合成 / 詐称 / HMM |
Research Abstract |
近年、音声による個人認証システムである話者照合システムの研究が行われており、オンラインショッピングや電話を用いた銀行取引における本人照合などへの応用が考えられている。音声を本人確認のためのキーとして用いる場合は、いかに本人以外の音声を受理する誤り(受理誤り率)を減らすかが重要となるが、現在のところ、他人の音声やテープレコーダを用いた詐称については考慮されているものの、音声合成システムを用いた詐称に対してはほとんど考慮されていなかった。これに対し、昨年度までの結果より、隠れマルコフモデル(HMM)に基づく音声合成システムを話者照合システムの登録話者による少量の音声を用いて学習することにより、HMM音声合成システムによる合成音声がテキスト指定型話者照合システムに高い確率で受理されることが確認されている。そこで、今年度はHMM音声合成システムによる合成音声を判別する手法の検討を行った。 ガウス混合モデル(GMM)に基づく話者照合システムにおいて、HMM音声合成システムから得られた合成音声には、通常の音声と比較してGMMに対する分析フレーム毎の対数尤度の変動が少ないという特徴が見られた。そこで、入力音声のGMMに対するフレーム尤度の変動量の平均をパラメータとして合成音声かどうかの判定を行う合成音声判別部を構築した。この合成音声判別部を話者照合システムに導入することにより、通常の音声に対する棄却誤り率を低く抑えながら、HMM音声合成システムによる合成音声に対する受理誤り率を大きく低下させることができた。今後の課題として、波形接続に基づく音声合成手法など、他の枠組の音声合成システムによる合成音声へに対する検討が挙げられる。
|
Report
(2 results)
Research Products
(5 results)