• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

複数のバイオメトリクス個人情報を利用したロバストな話者認識手法に関する研究

Research Project

Project/Area Number 14780274
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionNagoya University (2003)
Nagoya Institute of Technology (2002)

Principal Investigator

宮島 千代美  名古屋大学, 情報科学研究科, 助手 (90335092)

Project Period (FY) 2002 – 2003
Project Status Completed (Fiscal Year 2003)
Budget Amount *help
¥2,300,000 (Direct Cost: ¥2,300,000)
Fiscal Year 2003: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2002: ¥1,500,000 (Direct Cost: ¥1,500,000)
Keywordsバイオメトリクス / 音声 / 運転行動信号 / 個人識別 / 個人照合 / 混合正規分布 / 混合因子分析 / 確定的アニーリングEM / 個人認識 / 話者認識 / バイオメトリクス個人情報 / 顔画像 / 混合ガウスモデル / 確定的アニーリングEMアルゴリズム
Research Abstract

本研究では,音声や行動様式に含まれる個人性を利用したバイオメトリクス個人認識について以下の検討を行った.
(1)混合因子分析に基づく話者モデルのパラメータの共有構造について
我々は前年度までに,話者認識のモデルを混合因子分析に基づいて構築することによって,従来の混合正規分布に基づく話者モデルに比べて高い認識性能が得られることを報告した.本年度は,この混合因子分析における共分散行列のパラメータの共有方法の違いについて検討した.混合因子分析における共分散行列の因子負荷量,もしくは対角成分のパラメータを混合要素間で共有する場合と,パラメータを共有しない場合の三つの方法について比較した結果,対角要素のパラメータのみを共有する場合に最も良い認識結果が得られた.また,比較的小さい因子数でも高い認識性能が得られることがわかった.
(2)最小分類誤り学習による話者モデルのオンライン学習法について
音声で人を識別する家庭用ペットロボットのためのオンライン話者識別学習について検討した.ロボットが話者を誤って識別した場合に,不正解であるという情報のみがロボットへフィードバックされる状況を想定し,不正解であるという情報を有効利用するための最小分類誤り学習を提案した.実験の結果,不正解の情報を利用しない場合に比べ,約1.5倍の速度で学習ができることがわかった.また,過去に入力された音声データを複数まとめて,再度学習に利用することによって,より高速な学習が可能であることがわかった.
(3)運転行動信号を用いた個人認識について
自動車のアクセルやブレーキ,ハンドル操作などの運転行動に表れる個人性を利用して運転者を認識できれば,運転者に合わせた運転支援や車内環境の自動設定などへの応用が期待できる.アクセルペダル・ブレーキペダル踏力の分布を混合正規分布でモデル化し,30名の運転者の認識実験を行った結果,アクセル,もしくはブレーキのみでは30%程度の識別率であったのに対し,これらの信号の時間変化を動的特徴量として加え,さらにアクセルとブレーキを組み合わせて用いることにより73%まで識別率が向上した.また,動的特徴量を求める時間窓幅について検討した結果,800ms程度が最も有効であることがわかった.識別実験に加えて照合実験も行ったが,識別実験と同様の特徴量が有効であり,8%の等誤り率が得られた.運転行動信号を用いた個人認識の研究はこれまでに報告されていないが,本研究によってその可能性が示された.

Report

(2 results)
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • Research Products

    (12 results)

All Other

All Publications (12 results)

  • [Publications] K.Igarashi, C.Miyajima, K.Itou, K.Takeda, F.Itakura, H.Abut: "Biometric identification using driving behavioral signals"Proceedings of the 2004 IEEE International conference on Multimedia and Expo. 未定(発表予定). (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] H.Yamamoto, Y.Nankaku, C.Miyajima, K.Tokuda, T.Kitamura: "Parameter sharing and minimum classification error training of mixtures of factor analyzers for speaker identification"Proceedings of the 2004 IEEE International conference on Acoustics, Speech and Signal Processing. 未定(発表予定). (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 木田祐介, 山本啓善, 宮島千代美, 徳田恵一, 北村正: "制約条件下におけるMCE学習の検討-不正解時に正解を教えない学習-"2004年日本音響学会春季研究発表会講演論文集. vol.1. 173-174 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "混合因子分析に基づく話者識別モデルのパラメータ共有構造"情報処理学会音声言語処理研究会研究報告. vol.2003 no.124. 91-96 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 板谷洋平, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "DAEMアルゴリズムの音声・話者認識における有効性の検討"情報処理学会音声言語処理研究会研究報告. vol.2003 no.124. 1-6 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "混合因子分析に基づく話者モデルのパラメータ共有構造の検討"2003年日本音響学会秋季研究発表会講演論文集. vol.1. 101-102 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] H.Suzuki, H.Zen, Y.Nankaku, C.Miyajima, K.Tokuda, T.Kitamura: "Speech recognition using voice characteristic dependent acoustic models"Proceedings of 2003 IEEE International Conference on Acoustics, Speech, and Signal Processing. (未定)(発表予定). (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 板谷洋平, 宮島千代美, 徳田恵一, 北村正: "DAEMアルゴリズムを用いた話者認識のためのGMM学習法"2003年日本音響学会春季研究発表会講演論文集. vol.1. 115-116 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "混合因子分析に基づく話者識別モデルの最小分類誤り学習"2003年日本音響学会春季研究発表会講演論文集. vol.1. 111-112 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 石川剛, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "音響尤度のリスコアリングによる結果統合を用いたバイモーダル連続音声認識"2003年日本音響学会春季研究発表会講演論文集. vol.1. 193-195 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 山本真理, 柴田沙矢香, 南角吉彦, 宮島千代美, 徳田恵一, 北村正: "音声と顔画像を用いた個人認識"2002年情報科学技術フォーラム講演論文集. no.I-60. 119-120 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 柳哲, 柳生雄午, 宮島千代美, 徳田恵一, 北村正: "ジェスチャーを用いた個人識別におけるPCAの次元数の検討"2002年情報科学技術フォーラム講演論文集. no.I-21. 41-42 (2002)

    • Related Report
      2002 Annual Research Report

URL: 

Published: 2002-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi