• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 研究成果報告書

クラスタリングと教師なし適応学習に基づく時系列パターン認識システムの効率的な改善

研究課題

  • PDF
研究課題/領域番号 23700218
研究種目

若手研究(B)

配分区分基金
研究分野 知覚情報処理・知能ロボティクス
研究機関早稲田大学

研究代表者

小川 哲司  早稲田大学, 理工学術院, 准教授 (70386598)

研究期間 (年度) 2011 – 2012
キーワードクラスタリング / ベイズ学習 / 教師なし学習 / 音環境理解 / パターン認識
研究概要

音声データの構造化・検索支援のための基幹技術として, 音声データを発話者や雑音といった音環境ごとにクラスタリングする技術の開発と, 音声認識システムを教師なしの枠組みで適応的に最適化するための要素技術の開発を行った.

  • 研究成果

    (18件)

すべて 2013 2012 2011

すべて 雑誌論文 (18件) (うち査読あり 7件)

  • [雑誌論文] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013

    • 著者名/発表者名
      Tetsuji Ogawa, Feipeng Li, Hynek Hermansky
    • 雑誌名

      Proc. INTERSPEECH 2013

      巻: (to appear)

    • 査読あり
  • [雑誌論文] 話者認識で用いる機械学習2013

    • 著者名/発表者名
      小川哲司, 松井知子
    • 雑誌名

      日本音響学会誌

      巻: vol.69no.7(to appear)

  • [雑誌論文] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013

    • 著者名/発表者名
      小川哲司, Li Feipeng, Hermansky Hynek
    • 雑誌名

      音講論集

      ページ: 167-170

  • [雑誌論文] 話者認識技術の現状と課題2013

    • 著者名/発表者名
      網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標
    • 雑誌名

      信学技法(SP)

      巻: vol.112, no.450 ページ: 63-70

  • [雑誌論文] An improved entropy-based multiple kernel learning2012

    • 著者名/発表者名
      Hideitsu Hino and Tetsuji Ogawa
    • 雑誌名

      Proc. ICPR2012

      ページ: 1189-1192

    • 査読あり
  • [雑誌論文] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2012

    • 査読あり
  • [雑誌論文] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012

    • 著者名/発表者名
      福地佑介, 俵直弘, 小川哲司, 小林哲則
    • 雑誌名

      情処研報

      巻: vol.2012-SLP-02

  • [雑誌論文] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi
    • 雑誌名

      Proc. ICASSP2012

      ページ: 5253-5256

    • 査読あり
  • [雑誌論文] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • 雑誌名

      信学技報(IBISML)

      巻: vol.111, no.480 ページ: 21-28

  • [雑誌論文] 話者照合における因子分析に基づく特徴抽出に関する評価2012

    • 著者名/発表者名
      小川哲司, 小林哲則
    • 雑誌名

      音講論集

      ページ: 197-198

  • [雑誌論文] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • 雑誌名

      音講論集

      ページ: 207-210

  • [雑誌論文] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 小林哲則
    • 雑誌名

      第14回情報論的学習理論ワークショップ(IBIS2011)

      ページ: D-117

  • [雑誌論文] クラス内変動に頑健なカーネルマシンと話者照合への適用2011

    • 著者名/発表者名
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • 雑誌名

      音講論集

      ページ: 183-186

  • [雑誌論文] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011

    • 著者名/発表者名
      俵直弘, 渡部晋治, 小川哲司, 小林哲則
    • 雑誌名

      音講論集

      ページ: 175-178

  • [雑誌論文] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011

    • 著者名/発表者名
      Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2011

      ページ: 2741-2744

    • 査読あり
  • [雑誌論文] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011

    • 著者名/発表者名
      Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2011

      ページ: 2905-2908

    • 査読あり
  • [雑誌論文] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011

    • 著者名/発表者名
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • 雑誌名

      情処研報

      巻: vol.2011-SLP-87

  • [雑誌論文] Speaker recognition using multiple kernel learning based on conditional entropy minimization2011

    • 著者名/発表者名
      Tetsuji Ogawa, Hideitsu Hino, Nima Reyhani, Noboru Murata, and Tetsunori Kobayashi
    • 雑誌名

      Proc. ICASSP2011

      ページ: 2204-2207

    • 査読あり

URL: 

公開日: 2014-09-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi