研究概要 |
本研究では,音声や行動様式に含まれる個人性を利用したバイオメトリクス個人認識について以下の検討を行った. (1)混合因子分析に基づく話者モデルのパラメータの共有構造について 我々は前年度までに,話者認識のモデルを混合因子分析に基づいて構築することによって,従来の混合正規分布に基づく話者モデルに比べて高い認識性能が得られることを報告した.本年度は,この混合因子分析における共分散行列のパラメータの共有方法の違いについて検討した.混合因子分析における共分散行列の因子負荷量,もしくは対角成分のパラメータを混合要素間で共有する場合と,パラメータを共有しない場合の三つの方法について比較した結果,対角要素のパラメータのみを共有する場合に最も良い認識結果が得られた.また,比較的小さい因子数でも高い認識性能が得られることがわかった. (2)最小分類誤り学習による話者モデルのオンライン学習法について 音声で人を識別する家庭用ペットロボットのためのオンライン話者識別学習について検討した.ロボットが話者を誤って識別した場合に,不正解であるという情報のみがロボットへフィードバックされる状況を想定し,不正解であるという情報を有効利用するための最小分類誤り学習を提案した.実験の結果,不正解の情報を利用しない場合に比べ,約1.5倍の速度で学習ができることがわかった.また,過去に入力された音声データを複数まとめて,再度学習に利用することによって,より高速な学習が可能であることがわかった. (3)運転行動信号を用いた個人認識について 自動車のアクセルやブレーキ,ハンドル操作などの運転行動に表れる個人性を利用して運転者を認識できれば,運転者に合わせた運転支援や車内環境の自動設定などへの応用が期待できる.アクセルペダル・ブレーキペダル踏力の分布を混合正規分布でモデル化し,30名の運転者の認識実験を行った結果,アクセル,もしくはブレーキのみでは30%程度の識別率であったのに対し,これらの信号の時間変化を動的特徴量として加え,さらにアクセルとブレーキを組み合わせて用いることにより73%まで識別率が向上した.また,動的特徴量を求める時間窓幅について検討した結果,800ms程度が最も有効であることがわかった.識別実験に加えて照合実験も行ったが,識別実験と同様の特徴量が有効であり,8%の等誤り率が得られた.運転行動信号を用いた個人認識の研究はこれまでに報告されていないが,本研究によってその可能性が示された.
|