研究課題/領域番号 |
17650053
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
研究分担者 |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80335489)
|
キーワード | 話者認識 / 非可聴つぶやき声(NAM) / バイオメトリックス / 話者照合 / 体内音 / 無音声認識・無音声電話 |
研究概要 |
つぶやき声(NAM)の認証を行うNAMデータベースを構築(男性20名、女性20名)した。一時期のデータを用いて話者照合実験を行い、GMM(Gaussian Mixture Model)で2%以下の話者照合誤り率を、SVM(Support Vector Machine)で1%以下の話者照合誤り率を達成した。 以下、H17年度の研究の進捗を箇条書きにして、まとめておく。 (1)NAM音声個人認証データベースの設計を行なった。話者数は、男性20名、女性10名とした。キーワードは都道府県名を二つつなげたものとした。一人当たり本人キーワードを16回、他人のキーワード(29種)を2回発声した。体内音を収録した。時期差の影響も大きいと推察されるので、時期を変えて4回の収録を行った。 (2)セキュリティの厳しさのレベルを考えて、実験条件を次のように設定した。(a)話者と発声が異なる場合、(b)キーワードがもれた場合(なりすましの場合)、(c)本人がキーワードを間違えて発声した場合。同じ時期の発声に対しては、(a)の場合には約1%の照合誤り率を、(b)の場合には約2%の照合誤り率を、(c)の場合には約4%の照合誤り率を達成した。 (3)時期が異なる場合の話者照合の呼び実験も行った。NAMマイクの装着場所、つぶやき声の発声レベルなどの変動要因が多く、大幅に本人の照合率が低下する発声者の存在が明らかになった。 (4)時期差や発声の変動に対処することを目指して、DTW(非線形伸縮マッチング)と複数フレームからの動的特徴による話者照合アルゴリズムの検討を開始した。 (5)体内音も録音して、30名の話者のデータベースを構築した。
|