2004 Fiscal Year Annual Research Report

マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究

Research Project

Project/Area Number	16300036
Research Category	Grant-in-Aid for Scientific Research (B)
Research Institution	The Institute of Statistical Mathematics
Principal Investigator	松井知子統計数理研究所, 統計計算開発センター, 助教授 (10370090)
Co-Investigator(Kenkyū-buntansha)	田邉國士統計数理研究所, 予測制御研究系, 教授 (50000203)
Keywords	マルチメディア / モデル選択 / 判別予測 / カーネルマシン / 音声認識 / 話者認識 / 画像認識
Research Abstract	本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine (dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度は、マルチメディアデータの一つ、音声データを対象として、dPLRMの判別予測力を調査するとともに、その帰納力に関する検討を行った。具体的にはまず、テキスト独立型話者認識において、従来の混合ガウス分布モデルやサポートベクターマシンによる方法とその性能を比較した。話者10名が発声した音声による話者識別実験において、入力特徴量として26次元のメルケプストラムを用いた場合、dPLRMは従来法と同等以上の性能であることを示した。また、学習データ量を変化させた実験を通じて、dPLRMではカーネル関数により非線形性の扱いに優れ、また識別的な学習を行うために、比較的少量の学習データから各話者の特徴を捉えることができることを示した。なお、混合ガウス分布モデルによる方法は話者ごとに密度関数を推定するが、各話者の特徴を学習するのに、比較的多量のデータを必要とする。次いで、dPLRMを用いて、メルケプストラムの抽出に見られるような事前知識に基づく特徴抽出処理を行うことなく、学習データだけから識別的な話者特徴を暗に捉えることを試みた。dPLRMは非常に高い帰納力を有し、ロジスティック回帰機械の双対機械として、学習データ中の(隠れた)構造を幅広く表現することが期待できる。話者10名が異なる3時期に発声した音声による識別実験において、256次元の対数パワースペクトルを直接用いたdPLRM法は、26次元のメルケプストラムを用いた混合ガウス分布モデルに基づく従来法と比べて、同等以上の性能であることを示した。

Research Products
(4 results)

All 2005 2004

All Journal Article (4 results)

[Journal Article] dPLRMによる対数パワースペクトルを用いた話者識別2005
- Author(s)
  松井知子, 田邉國士
- Journal Title
  
  日本音響学会研究発表会講演論文集春季・I
  
  Pages: 87-88
[Journal Article] 罰金付きロジスティック回帰マシンによる話者識別2004
- Author(s)
  松井知子, 田邉國士
- Journal Title
  
  日本音響学会研究発表会講演論文集秋季・I
  
  Pages: 11-12
[Journal Article] Probabilistic Speaker Identification with dual Penalized Logistic Regression Machine2004
- Author(s)
  T.Matsui, K.Tanabe
- Journal Title
  
  Proc.8th International Conference on Spoken Language Processing
  
  Pages: 1797-1800
[Journal Article] Speaker Recognition without Feature Extraction Process2004
- Author(s)
  T.Matsui, K.Tanabe
- Journal Title
  
  Proc.Workshop on Statisitcal Modeling Approach for Speech Recognition
  
  Pages: 79-84

2004 Fiscal Year Annual Research Report

マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究

Principal Investigator

松井 知子 統計数理研究所, 統計計算開発センター, 助教授 (10370090)

Research Products

[Journal Article] dPLRMによる対数パワースペクトルを用いた話者識別2005

Author(s)

Journal Title

[Journal Article] 罰金付きロジスティック回帰マシンによる話者識別2004

Author(s)

Journal Title

[Journal Article] Probabilistic Speaker Identification with dual Penalized Logistic Regression Machine2004

Author(s)

Journal Title

[Journal Article] Speaker Recognition without Feature Extraction Process2004

Author(s)

Journal Title

松井知子統計数理研究所, 統計計算開発センター, 助教授 (10370090)