2014 Fiscal Year Annual Research Report
カーネル法に基づいた歪みに頑健な話者照合システムの構築
Project/Area Number |
25880026
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
塩田 さやか 首都大学東京, システムデザイン研究科, 助教 (90705039)
|
Project Period (FY) |
2013-08-30 – 2015-03-31
|
Keywords | 話者照合 / 音声信号処理 / 統計的機械学習 |
Outline of Annual Research Achievements |
本研究の目的は音声を用いた生体認証技術である話者照合における性能向上である。従来の話者照合ではモデルを学習し、そのモデルと評価データ間の照合を行っていた。しかし、モデルを学習するためには膨大な量の学習データ量が必要であり、また、学習モデルと評価データ間の雑音やチャンネルの違いによる精度低下という問題がある。そこで本研究ではモデルの学習を行わないでサンプル間の距離をカーネル空間上で測る最大平均差異(MMD)という指標を用い話者照合を行うことを検討した。研究計画ではまず、MMDを用いた照合手法の確立を目指したが、理論的に計算を行ったところ、純粋なMMDでは精度の高い話者照合を行うことが困難であることがわかった。そこで海外の研究者ともディスカッションを重ね、話者照合に適したMMDの計算方法と照合方法を検討した。その結果研究計画としては当初の予定から遅れたが話者照合にも使用可能なカーネルを使用したMMDを使用することが可能となった。提案法では、入力データと登録データそれぞれの分布をカーネル空間上で測り、その距離を統計的枠組みにより識別することで最終的に日本語の話者照合データを用いた場合には従来法とも比べ非常に高い識別性能を得ることができた。予定が遅れてしまったが、発表は今後も積極的に行っていく予定である。また、現在の方法では当初目指していた雑音環境やチャンネルの違いによる影響を受けた場合には照合精度が下がることが確認されているのでさらなる検討を行う必要がある。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|