2012 Fiscal Year Final Research Report

Effective improvement of time-series pattern recognition systems using clustering and unsupervised adaptive training

Research Project

Project/Area Number	23700218
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Multi-year Fund
Research Field	Perception information processing/Intelligent robotics
Research Institution	Waseda University
Principal Investigator	OGAWA Tetsuji 早稲田大学, 理工学術院, 准教授 (70386598)
Project Period (FY)	2011 – 2012
Keywords	クラスタリング / ベイズ学習 / 教師なし学習 / 音環境理解 / パターン認識
Research Abstract	I developed technologies for clustering speech data into acoustic attributes such as speakers and types of noise and technologies for adaptively optimizing speech recognition systems in unsupervised ways. The developed technologies would be essential for constructing a system structuring speech data and a speech retrieval system.

Research Products
(18 results)

All 2013 2012 2011

All Journal Article (18 results) (of which Peer Reviewed: 7 results)

[Journal Article] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013
- Author(s)
  Tetsuji Ogawa, Feipeng Li, Hynek Hermansky
- Journal Title
  
  Proc. INTERSPEECH 2013
  
  Volume: (to appear)
- Peer Reviewed
[Journal Article] 話者認識で用いる機械学習2013
- Author(s)
  小川哲司, 松井知子
- Journal Title
  
  日本音響学会誌
  
  Volume: vol.69no.7(to appear)
[Journal Article] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013
- Author(s)
  小川哲司, Li Feipeng, Hermansky Hynek
- Journal Title
  
  音講論集
  
  Pages: 167-170
[Journal Article] 話者認識技術の現状と課題2013
- Author(s)
  網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標
- Journal Title
  
  信学技法(SP)
  
  Volume: vol.112, no.450 Pages: 63-70
[Journal Article] An improved entropy-based multiple kernel learning2012
- Author(s)
  Hideitsu Hino and Tetsuji Ogawa
- Journal Title
  
  Proc. ICPR2012
  
  Pages: 1189-1192
- Peer Reviewed
[Journal Article] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012
- Author(s)
  Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
- Journal Title
  
  Proc. INTERSPEECH2012
- Peer Reviewed
[Journal Article] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012
- Author(s)
  福地佑介, 俵直弘, 小川哲司, 小林哲則
- Journal Title
  
  情処研報
  
  Volume: vol.2012-SLP-02
[Journal Article] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012
- Author(s)
  Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi
- Journal Title
  
  Proc. ICASSP2012
  
  Pages: 5253-5256
- Peer Reviewed
[Journal Article] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012
- Author(s)
  俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
- Journal Title
  
  信学技報(IBISML)
  
  Volume: vol.111, no.480 Pages: 21-28
[Journal Article] 話者照合における因子分析に基づく特徴抽出に関する評価2012
- Author(s)
  小川哲司, 小林哲則
- Journal Title
  
  音講論集
  
  Pages: 197-198
[Journal Article] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012
- Author(s)
  俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
- Journal Title
  
  音講論集
  
  Pages: 207-210
[Journal Article] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011
- Author(s)
  俵直弘, 小川哲司, 渡部晋治, 小林哲則
- Journal Title
  
  第14回情報論的学習理論ワークショップ(IBIS2011)
  
  Pages: D-117
[Journal Article] クラス内変動に頑健なカーネルマシンと話者照合への適用2011
- Author(s)
  小川哲司, 日野英逸, 村田昇, 小林哲則
- Journal Title
  
  音講論集
  
  Pages: 183-186
[Journal Article] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011
- Author(s)
  俵直弘, 渡部晋治, 小川哲司, 小林哲則
- Journal Title
  
  音講論集
  
  Pages: 175-178
[Journal Article] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011
- Author(s)
  Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi
- Journal Title
  
  Proc. INTERSPEECH2011
  
  Pages: 2741-2744
- Peer Reviewed
[Journal Article] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011
- Author(s)
  Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa and Tetsunori Kobayashi
- Journal Title
  
  Proc. INTERSPEECH2011
  
  Pages: 2905-2908
- Peer Reviewed
[Journal Article] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011
- Author(s)
  小川哲司, 日野英逸, 村田昇, 小林哲則
- Journal Title
  
  情処研報
  
  Volume: vol.2011-SLP-87
[Journal Article] Speaker recognition using multiple kernel learning based on conditional entropy minimization2011
- Author(s)
  Tetsuji Ogawa, Hideitsu Hino, Nima Reyhani, Noboru Murata, and Tetsunori Kobayashi
- Journal Title
  
  Proc. ICASSP2011
  
  Pages: 2204-2207
- Peer Reviewed

2012 Fiscal Year Final Research Report

Effective improvement of time-series pattern recognition systems using clustering and unsupervised adaptive training

Principal Investigator

OGAWA Tetsuji 早稲田大学, 理工学術院, 准教授 (70386598)

Research Products

[Journal Article] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013

Author(s)

Journal Title

[Journal Article] 話者認識で用いる機械学習2013

Author(s)

Journal Title

[Journal Article] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013

Author(s)

Journal Title

[Journal Article] 話者認識技術の現状と課題2013

Author(s)

Journal Title

[Journal Article] An improved entropy-based multiple kernel learning2012

Author(s)

Journal Title

[Journal Article] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012

Author(s)

Journal Title

[Journal Article] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012

Author(s)

Journal Title

[Journal Article] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012

Author(s)

Journal Title

[Journal Article] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012

Author(s)

Journal Title

[Journal Article] 話者照合における因子分析に基づく特徴抽出に関する評価2012

Author(s)

Journal Title

[Journal Article] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012

Author(s)

Journal Title

[Journal Article] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011

Author(s)

Journal Title

[Journal Article] クラス内変動に頑健なカーネルマシンと話者照合への適用2011

Author(s)

Journal Title

[Journal Article] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011

Author(s)

Journal Title

[Journal Article] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011

Author(s)

Journal Title

[Journal Article] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011

Author(s)

Journal Title

[Journal Article] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011

Author(s)

Journal Title

[Journal Article] Speaker recognition using multiple kernel learning based on conditional entropy minimization2011

Author(s)

Journal Title