2003 Fiscal Year Annual Research Report
複数のバイオメトリクス個人情報を利用したロバストな話者認識手法に関する研究
Project/Area Number |
14780274
|
Research Institution | Nagoya University |
Principal Investigator |
宮島 千代美 名古屋大学, 情報科学研究科, 助手 (90335092)
|
Keywords | バイオメトリクス / 音声 / 運転行動信号 / 個人識別 / 個人照合 / 混合正規分布 / 混合因子分析 / 確定的アニーリングEM |
Research Abstract |
本研究では,音声や行動様式に含まれる個人性を利用したバイオメトリクス個人認識について以下の検討を行った. (1)混合因子分析に基づく話者モデルのパラメータの共有構造について 我々は前年度までに,話者認識のモデルを混合因子分析に基づいて構築することによって,従来の混合正規分布に基づく話者モデルに比べて高い認識性能が得られることを報告した.本年度は,この混合因子分析における共分散行列のパラメータの共有方法の違いについて検討した.混合因子分析における共分散行列の因子負荷量,もしくは対角成分のパラメータを混合要素間で共有する場合と,パラメータを共有しない場合の三つの方法について比較した結果,対角要素のパラメータのみを共有する場合に最も良い認識結果が得られた.また,比較的小さい因子数でも高い認識性能が得られることがわかった. (2)最小分類誤り学習による話者モデルのオンライン学習法について 音声で人を識別する家庭用ペットロボットのためのオンライン話者識別学習について検討した.ロボットが話者を誤って識別した場合に,不正解であるという情報のみがロボットへフィードバックされる状況を想定し,不正解であるという情報を有効利用するための最小分類誤り学習を提案した.実験の結果,不正解の情報を利用しない場合に比べ,約1.5倍の速度で学習ができることがわかった.また,過去に入力された音声データを複数まとめて,再度学習に利用することによって,より高速な学習が可能であることがわかった. (3)運転行動信号を用いた個人認識について 自動車のアクセルやブレーキ,ハンドル操作などの運転行動に表れる個人性を利用して運転者を認識できれば,運転者に合わせた運転支援や車内環境の自動設定などへの応用が期待できる.アクセルペダル・ブレーキペダル踏力の分布を混合正規分布でモデル化し,30名の運転者の認識実験を行った結果,アクセル,もしくはブレーキのみでは30%程度の識別率であったのに対し,これらの信号の時間変化を動的特徴量として加え,さらにアクセルとブレーキを組み合わせて用いることにより73%まで識別率が向上した.また,動的特徴量を求める時間窓幅について検討した結果,800ms程度が最も有効であることがわかった.識別実験に加えて照合実験も行ったが,識別実験と同様の特徴量が有効であり,8%の等誤り率が得られた.運転行動信号を用いた個人認識の研究はこれまでに報告されていないが,本研究によってその可能性が示された.
|
Research Products
(6 results)
-
[Publications] K.Igarashi, C.Miyajima, K.Itou, K.Takeda, F.Itakura, H.Abut: "Biometric identification using driving behavioral signals"Proceedings of the 2004 IEEE International conference on Multimedia and Expo. 未定(発表予定). (2004)
-
[Publications] H.Yamamoto, Y.Nankaku, C.Miyajima, K.Tokuda, T.Kitamura: "Parameter sharing and minimum classification error training of mixtures of factor analyzers for speaker identification"Proceedings of the 2004 IEEE International conference on Acoustics, Speech and Signal Processing. 未定(発表予定). (2004)
-
[Publications] 木田祐介, 山本啓善, 宮島千代美, 徳田恵一, 北村正: "制約条件下におけるMCE学習の検討-不正解時に正解を教えない学習-"2004年日本音響学会春季研究発表会講演論文集. vol.1. 173-174 (2004)
-
[Publications] 山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "混合因子分析に基づく話者識別モデルのパラメータ共有構造"情報処理学会音声言語処理研究会研究報告. vol.2003 no.124. 91-96 (2003)
-
[Publications] 板谷洋平, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "DAEMアルゴリズムの音声・話者認識における有効性の検討"情報処理学会音声言語処理研究会研究報告. vol.2003 no.124. 1-6 (2003)
-
[Publications] 山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "混合因子分析に基づく話者モデルのパラメータ共有構造の検討"2003年日本音響学会秋季研究発表会講演論文集. vol.1. 101-102 (2003)