2006 年度実績報告書

マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究

研究課題

研究課題/領域番号	16300036
研究機関	統計数理研究所
研究代表者	松井知子統計数理研究所, モデリング研究系, 助教授 (10370090)
研究分担者	田邉國士早稲田大学, 理工学術院, 教授 (50000203)
キーワード	カーネルマシン / モデル選択 / 判別予測 / マルチメディア / 音声認識 / 話者認識
研究概要	本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine(dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度はdPLRMに関して1)大規模データの処理、2)複数の特徴量の扱い、3)時定数を異にするデータのコーディング、4)可変長データの処理の四つの項目について主に検討を行った。各項目の実績概要は次の通りである。 1)大規模データの処理 dPLRMの学習において大規模なデータセットを利用することを目的として、最尤基準に基づいてデータを選択的に用いるGreedy学習法を提案した。この方法により、数十万サンプル程度の学習データも扱えるようになった。 2)複数の特徴量の扱い複数の特徴量を効果的に組合せることを目的として、dPLRMのマルチカーネル化を行った。音素識別実験において、このマルチカーネル化dPLRMにより複数の音響特徴量の中で有効なものを選択的に用いることができることを確かめた。 3)時定数を異にするデータのコーディング映像検索のタスクにおいて、時定数を異にする画像とテキスト(音声認識結果、発声していない区間もある)を同時に扱うために、テキストに関する特徴量ベクトルに発声をしていないことを表す次元を付加するコーディング法を考案した。予備実験において、本コーディング法を用いて画像とテキストの特徴量ベクトルを一つに統合することにより、画像とテキストの組み合わせ効果が得られることを確認した。 4)可変長データの処理異なる長さの時系列データを扱えるカーネル関数の設計を行った。dPLRMにそのカーネル関数を組み込み、孤立発声単語認識実験において効果を確かめた。

研究成果
(6件)

すべて 2007 2006

すべて雑誌論文 (6件)

[雑誌論文] Information fusion using multiple kernel logistic regression with applications to phonetic feature detection2007
- 著者名/発表者名
  T.A.Myrvoll, 松井知子
- 雑誌名
  
  日本音響学会2007春季研究発表会講演論文集
  
  ページ: 49-50
[雑誌論文] Phoneme recognition using global alignment kernel2007
- 著者名/発表者名
  M.Cuturi, J.-P.Vert, O.Birkenes, 松井知子
- 雑誌名
  
  日本音響学会2007春季研究発表会講演論文集
  
  ページ: 51-52
[雑誌論文] Isolated-Word Recognition with Penalized Logistic Regression Machines2006
- 著者名/発表者名
  O.Birkenes, T.Matsui, K.Tanabe
- 雑誌名
  
  Proceedings of 2006 IEEE International Conference on Acoustics, Speech, and Signal Processing I
  
  ページ: 405-408
[雑誌論文] Continuous Speech Recognition with Penalized Logistic Regression Machines2006
- 著者名/発表者名
  O.Birkenes, T.Matsui, K.Tanabe, T.A.Myrvoll
- 雑誌名
  
  Proceeding of 7th NORDIC SIGNAL PROCESSING SYMPOSIUM
[雑誌論文] On a Greedy Learning Algorithm for dPLRM with Applications to Phonetic Feature Detection2006
- 著者名/発表者名
  T.A.Myrvoll, T.Matsui
- 雑誌名
  
  Proceedings of Interspeech 2006
  
  ページ: 1690-1693
[雑誌論文] Shot Boundary Detection and High-Level Feature Extraction Experiments for TRECVID 20062006
- 著者名/発表者名
  M.Naito, K.Matsumoto, M.Shishibori, K.Kita, M.Cuturi, T.Matsui, S.Sato, K.Hoashi, F.Sugaya, Y.Nakajima
- 雑誌名
  
  Proceeding of TRECVID 2006 Workshop

2006 年度 実績報告書

マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究

研究代表者

松井 知子 統計数理研究所, モデリング研究系, 助教授 (10370090)

研究成果

[雑誌論文] Information fusion using multiple kernel logistic regression with applications to phonetic feature detection2007

著者名/発表者名

雑誌名

[雑誌論文] Phoneme recognition using global alignment kernel2007

著者名/発表者名

雑誌名

[雑誌論文] Isolated-Word Recognition with Penalized Logistic Regression Machines2006

著者名/発表者名

雑誌名

[雑誌論文] Continuous Speech Recognition with Penalized Logistic Regression Machines2006

著者名/発表者名

雑誌名

[雑誌論文] On a Greedy Learning Algorithm for dPLRM with Applications to Phonetic Feature Detection2006

著者名/発表者名

雑誌名

[雑誌論文] Shot Boundary Detection and High-Level Feature Extraction Experiments for TRECVID 20062006

著者名/発表者名

雑誌名

2006 年度実績報告書

松井知子統計数理研究所, モデリング研究系, 助教授 (10370090)