• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

マルチメディア異種混合データの自動モデル選択による判別予測方式に関する研究

Research Project

Project/Area Number 16300036
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

松井 知子  統計数理研究所, モデリング研究系, 助教授 (10370090)

Co-Investigator(Kenkyū-buntansha) 田邉 國士  早稲田大学, 理工学術院, 教授 (50000203)
Keywordsカーネルマシン / モデル選択 / 判別予測 / マルチメディア / 音声認識 / 話者認識
Research Abstract

本研究では、研究分担者(田邉)によって開発された確率的予測推論機械dual Penalized Logistic Regression Machine(dPLRM)を用いたマルチメディア異種混合データの判別予測方式を確立することを目的とする。本年度はdPLRMに関して1)大規模データの処理、2)複数の特徴量の扱い、3)時定数を異にするデータのコーディング、4)可変長データの処理の四つの項目について主に検討を行った。各項目の実績概要は次の通りである。
1)大規模データの処理
dPLRMの学習において大規模なデータセットを利用することを目的として、最尤基準に基づいてデータを選択的に用いるGreedy学習法を提案した。この方法により、数十万サンプル程度の学習データも扱えるようになった。
2)複数の特徴量の扱い
複数の特徴量を効果的に組合せることを目的として、dPLRMのマルチカーネル化を行った。音素識別実験において、このマルチカーネル化dPLRMにより複数の音響特徴量の中で有効なものを選択的に用いることができることを確かめた。
3)時定数を異にするデータのコーディング
映像検索のタスクにおいて、時定数を異にする画像とテキスト(音声認識結果、発声していない区間もある)を同時に扱うために、テキストに関する特徴量ベクトルに発声をしていないことを表す次元を付加するコーディング法を考案した。予備実験において、本コーディング法を用いて画像とテキストの特徴量ベクトルを一つに統合することにより、画像とテキストの組み合わせ効果が得られることを確認した。
4)可変長データの処理
異なる長さの時系列データを扱えるカーネル関数の設計を行った。dPLRMにそのカーネル関数を組み込み、孤立発声単語認識実験において効果を確かめた。

  • Research Products

    (6 results)

All 2007 2006

All Journal Article (6 results)

  • [Journal Article] Information fusion using multiple kernel logistic regression with applications to phonetic feature detection2007

    • Author(s)
      T.A.Myrvoll, 松井知子
    • Journal Title

      日本音響学会2007春季研究発表会講演論文集

      Pages: 49-50

  • [Journal Article] Phoneme recognition using global alignment kernel2007

    • Author(s)
      M.Cuturi, J.-P.Vert, O.Birkenes, 松井知子
    • Journal Title

      日本音響学会2007春季研究発表会講演論文集

      Pages: 51-52

  • [Journal Article] Isolated-Word Recognition with Penalized Logistic Regression Machines2006

    • Author(s)
      O.Birkenes, T.Matsui, K.Tanabe
    • Journal Title

      Proceedings of 2006 IEEE International Conference on Acoustics, Speech, and Signal Processing I

      Pages: 405-408

  • [Journal Article] Continuous Speech Recognition with Penalized Logistic Regression Machines2006

    • Author(s)
      O.Birkenes, T.Matsui, K.Tanabe, T.A.Myrvoll
    • Journal Title

      Proceeding of 7th NORDIC SIGNAL PROCESSING SYMPOSIUM

  • [Journal Article] On a Greedy Learning Algorithm for dPLRM with Applications to Phonetic Feature Detection2006

    • Author(s)
      T.A.Myrvoll, T.Matsui
    • Journal Title

      Proceedings of Interspeech 2006

      Pages: 1690-1693

  • [Journal Article] Shot Boundary Detection and High-Level Feature Extraction Experiments for TRECVID 20062006

    • Author(s)
      M.Naito, K.Matsumoto, M.Shishibori, K.Kita, M.Cuturi, T.Matsui, S.Sato, K.Hoashi, F.Sugaya, Y.Nakajima
    • Journal Title

      Proceeding of TRECVID 2006 Workshop

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi