• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Final Research Report

Effective improvement of time-series pattern recognition systems using clustering and unsupervised adaptive training

Research Project

  • PDF
Project/Area Number 23700218
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeMulti-year Fund
Research Field Perception information processing/Intelligent robotics
Research InstitutionWaseda University

Principal Investigator

OGAWA Tetsuji  早稲田大学, 理工学術院, 准教授 (70386598)

Project Period (FY) 2011 – 2012
Keywordsクラスタリング / ベイズ学習 / 教師なし学習 / 音環境理解 / パターン認識
Research Abstract

I developed technologies for clustering speech data into acoustic attributes such as speakers and types of noise and technologies for adaptively optimizing speech recognition systems in unsupervised ways. The developed technologies would be essential for constructing a system structuring speech data and a speech retrieval system.

  • Research Products

    (18 results)

All 2013 2012 2011

All Journal Article (18 results) (of which Peer Reviewed: 7 results)

  • [Journal Article] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013

    • Author(s)
      Tetsuji Ogawa, Feipeng Li, Hynek Hermansky
    • Journal Title

      Proc. INTERSPEECH 2013

      Volume: (to appear)

    • Peer Reviewed
  • [Journal Article] 話者認識で用いる機械学習2013

    • Author(s)
      小川哲司, 松井知子
    • Journal Title

      日本音響学会誌

      Volume: vol.69no.7(to appear)

  • [Journal Article] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013

    • Author(s)
      小川哲司, Li Feipeng, Hermansky Hynek
    • Journal Title

      音講論集

      Pages: 167-170

  • [Journal Article] 話者認識技術の現状と課題2013

    • Author(s)
      網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標
    • Journal Title

      信学技法(SP)

      Volume: vol.112, no.450 Pages: 63-70

  • [Journal Article] An improved entropy-based multiple kernel learning2012

    • Author(s)
      Hideitsu Hino and Tetsuji Ogawa
    • Journal Title

      Proc. ICPR2012

      Pages: 1189-1192

    • Peer Reviewed
  • [Journal Article] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012

    • Author(s)
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
    • Journal Title

      Proc. INTERSPEECH2012

    • Peer Reviewed
  • [Journal Article] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012

    • Author(s)
      福地佑介, 俵直弘, 小川哲司, 小林哲則
    • Journal Title

      情処研報

      Volume: vol.2012-SLP-02

  • [Journal Article] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012

    • Author(s)
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi
    • Journal Title

      Proc. ICASSP2012

      Pages: 5253-5256

    • Peer Reviewed
  • [Journal Article] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012

    • Author(s)
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • Journal Title

      信学技報(IBISML)

      Volume: vol.111, no.480 Pages: 21-28

  • [Journal Article] 話者照合における因子分析に基づく特徴抽出に関する評価2012

    • Author(s)
      小川哲司, 小林哲則
    • Journal Title

      音講論集

      Pages: 197-198

  • [Journal Article] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012

    • Author(s)
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • Journal Title

      音講論集

      Pages: 207-210

  • [Journal Article] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011

    • Author(s)
      俵直弘, 小川哲司, 渡部晋治, 小林哲則
    • Journal Title

      第14回情報論的学習理論ワークショップ(IBIS2011)

      Pages: D-117

  • [Journal Article] クラス内変動に頑健なカーネルマシンと話者照合への適用2011

    • Author(s)
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • Journal Title

      音講論集

      Pages: 183-186

  • [Journal Article] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011

    • Author(s)
      俵直弘, 渡部晋治, 小川哲司, 小林哲則
    • Journal Title

      音講論集

      Pages: 175-178

  • [Journal Article] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011

    • Author(s)
      Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi
    • Journal Title

      Proc. INTERSPEECH2011

      Pages: 2741-2744

    • Peer Reviewed
  • [Journal Article] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011

    • Author(s)
      Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa and Tetsunori Kobayashi
    • Journal Title

      Proc. INTERSPEECH2011

      Pages: 2905-2908

    • Peer Reviewed
  • [Journal Article] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011

    • Author(s)
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • Journal Title

      情処研報

      Volume: vol.2011-SLP-87

  • [Journal Article] Speaker recognition using multiple kernel learning based on conditional entropy minimization2011

    • Author(s)
      Tetsuji Ogawa, Hideitsu Hino, Nima Reyhani, Noboru Murata, and Tetsunori Kobayashi
    • Journal Title

      Proc. ICASSP2011

      Pages: 2204-2207

    • Peer Reviewed

URL: 

Published: 2014-09-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi