• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

クラスタリングと教師なし適応学習に基づく時系列パターン認識システムの効率的な改善

研究課題

研究課題/領域番号 23700218
研究種目

若手研究(B)

配分区分基金
研究分野 知覚情報処理・知能ロボティクス
研究機関早稲田大学

研究代表者

小川 哲司  早稲田大学, 理工学術院, 准教授 (70386598)

研究期間 (年度) 2011 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2012年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2011年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワードクラスタリング / ベイズ学習 / 教師なし学習 / 音環境理解 / パターン認識
研究概要

音声データの構造化・検索支援のための基幹技術として, 音声データを発話者や雑音といった音環境ごとにクラスタリングする技術の開発と, 音声認識システムを教師なしの枠組みで適応的に最適化するための要素技術の開発を行った.

報告書

(3件)
  • 2012 実績報告書   研究成果報告書 ( PDF )
  • 2011 実施状況報告書
  • 研究成果

    (34件)

すべて 2013 2012 2011

すべて 雑誌論文 (22件) (うち査読あり 11件) 学会発表 (12件)

  • [雑誌論文] Stream selection and integration in multistream ASR using GMM-based performance monitoring2013

    • 著者名/発表者名
      Tetsuji Ogawa, Feipeng Li, Hynek Hermansky
    • 雑誌名

      Proc. INTERSPEECH 2013

      巻: (to appear)

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 話者認識で用いる機械学習2013

    • 著者名/発表者名
      小川哲司, 松井知子
    • 雑誌名

      日本音響学会誌

      巻: vol.69no.7(to appear)

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013

    • 著者名/発表者名
      小川哲司, Li Feipeng, Hermansky Hynek
    • 雑誌名

      音講論集

      ページ: 167-170

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] 話者認識技術の現状と課題2013

    • 著者名/発表者名
      網野加苗, 石原俊一, 小川哲司, 長内隆, 黒岩眞吾, 仲孝文, 篠田浩一, 柘植覚, 西田昌史, 松井知子, 王龍標
    • 雑誌名

      信学技法(SP)

      巻: vol.112, no.450 ページ: 63-70

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] An improved entropy-based multiple kernel learning2012

    • 著者名/発表者名
      Hideitsu Hino and Tetsuji Ogawa
    • 雑誌名

      Proc. ICPR2012

      ページ: 1189-1192

    • 関連する報告書
      2012 実績報告書 2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2012

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012

    • 著者名/発表者名
      福地佑介, 俵直弘, 小川哲司, 小林哲則
    • 雑誌名

      情処研報

      巻: vol.2012-SLP-02

    • NAID

      110009422505

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi
    • 雑誌名

      Proc. ICASSP2012

      ページ: 5253-5256

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • 雑誌名

      信学技報(IBISML)

      巻: vol.111, no.480 ページ: 21-28

    • NAID

      110009545971

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] 話者照合における因子分析に基づく特徴抽出に関する評価2012

    • 著者名/発表者名
      小川哲司, 小林哲則
    • 雑誌名

      音講論集

      ページ: 197-198

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 中村篤, 小林哲則
    • 雑誌名

      音講論集

      ページ: 207-210

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, and Tetsunori Kobayashi
    • 雑誌名

      Proc. Interspeech2012

      巻: -

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering2012

    • 著者名/発表者名
      Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, and Tetsunori Kobayashi
    • 雑誌名

      Proc. ICASSP2012

      巻: - ページ: 5253-5256

    • 関連する報告書
      2011 実施状況報告書
    • 査読あり
  • [雑誌論文] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011

    • 著者名/発表者名
      俵直弘, 小川哲司, 渡部晋治, 小林哲則
    • 雑誌名

      第14回情報論的学習理論ワークショップ(IBIS2011)

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] クラス内変動に頑健なカーネルマシンと話者照合への適用2011

    • 著者名/発表者名
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • 雑誌名

      音講論集

      ページ: 183-186

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011

    • 著者名/発表者名
      俵直弘, 渡部晋治, 小川哲司, 小林哲則
    • 雑誌名

      音講論集

      ページ: 175-178

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011

    • 著者名/発表者名
      Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2011

      ページ: 2741-2744

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011

    • 著者名/発表者名
      Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa and Tetsunori Kobayashi
    • 雑誌名

      Proc. INTERSPEECH2011

      ページ: 2905-2908

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011

    • 著者名/発表者名
      小川哲司, 日野英逸, 村田昇, 小林哲則
    • 雑誌名

      情処研報

      巻: vol.2011-SLP-87

    • NAID

      110008584130

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Speaker recognition using multiple kernel learning based on conditional entropy minimization2011

    • 著者名/発表者名
      Tetsuji Ogawa, Hideitsu Hino, Nima Reyhani, Noboru Murata, and Tetsunori Kobayashi
    • 雑誌名

      Proc. ICASSP2011

      ページ: 2204-2207

    • 関連する報告書
      2012 研究成果報告書 2011 実施状況報告書
    • 査読あり
  • [雑誌論文] Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization2011

    • 著者名/発表者名
      Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi
    • 雑誌名

      Proc. Interspeech2011

      巻: - ページ: 2741-2744

    • 関連する報告書
      2011 実施状況報告書
    • 査読あり
  • [雑誌論文] Speaker clustering based on utterance-oriented Dirichelet process mixture model2011

    • 著者名/発表者名
      Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa, and Tetsunori Kobayashi
    • 雑誌名

      Proc. Interspeech2011

      巻: - ページ: 2905-2908

    • 関連する報告書
      2011 実施状況報告書
    • 査読あり
  • [学会発表] 話者認識技術の現状と課題2013

    • 著者名/発表者名
      網野加苗,石原俊一,小川哲司,長内隆,黒岩眞吾,越仲孝文,篠田浩一,柘植覚,西田昌史,松井知子,王龍標
    • 学会等名
      電子情報通信学会2013年2月度音声研究会
    • 発表場所
      大同大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識2013

    • 著者名/発表者名
      小川哲司,Li Feipeng,Hermansky Hynek
    • 学会等名
      日本音響学会 2013年春季研究発表会
    • 発表場所
      東京工科大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 指向性を付与したマルチチャネルウィーナフィルタを前段に持つ音源分離方式の検討2013

    • 著者名/発表者名
      大町基,小川哲司,赤桐健三,小林哲則
    • 学会等名
      日本音響学会 2013年春季研究発表会
    • 発表場所
      東京工科大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用2012

    • 著者名/発表者名
      福地佑介,俵直弘,小川哲司,小林哲則
    • 学会等名
      情報処理学会 第92回音声言語情報処理研究発表会
    • 発表場所
      天童温泉滝の湯(山形県天童市)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 天井設置型マイクロホンアレイにおいて残響が音声の分離・認識性能に与える影響2012

    • 著者名/発表者名
      大町 基,小川哲司,小林哲則
    • 学会等名
      日本音響学会 2012年秋季研究発表会
    • 発表場所
      信州大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング2012

    • 著者名/発表者名
      俵直弘,小川哲司,渡部晋治,中村篤,小林哲則
    • 学会等名
      電子情報通信学会・第8回 情報論的学習理論と機械学習研究会
    • 発表場所
      東京都立川市,統計数理研究所
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 話者照合における因子分析に基づく特徴抽出に関する評価2012

    • 著者名/発表者名
      小川哲司,小林哲則
    • 学会等名
      2012年日本音響学会春季研究発表会
    • 発表場所
      神奈川県横浜市,神奈川大学横浜キャンパス
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価2012

    • 著者名/発表者名
      俵直弘,小川哲司,渡部晋治,中村篤,小林哲則
    • 学会等名
      2012年日本音響学会春季研究発表会
    • 発表場所
      神奈川県横浜市,神奈川大学横浜キャンパス
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較2011

    • 著者名/発表者名
      俵直弘,小川哲司,渡部晋治,小林哲則
    • 学会等名
      第14回 情報論的学習理論ワークショップ
    • 発表場所
      奈良県奈良市,奈良女子大学
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合2011

    • 著者名/発表者名
      小川哲司,日野英逸,村田昇,小林哲則
    • 学会等名
      情報処理学会・第87回 音声言語情報処理研究会
    • 発表場所
      北海道札幌市,定山渓温泉 定山渓グランドホテル瑞苑
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] クラス内変動に頑健なカーネルマシンと話者照合への適用2011

    • 著者名/発表者名
      小川哲司,日野英逸,村田昇,小林哲則
    • 学会等名
      2011年日本音響学会秋季研究発表会
    • 発表場所
      島根県松江市,島根大学松江キャンパス
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価2011

    • 著者名/発表者名
      俵直弘,渡部晋治,小川哲司,小林哲則
    • 学会等名
      2011年日本音響学会秋季研究発表会
    • 発表場所
      島根県松江市,島根大学松江キャンパス
    • 関連する報告書
      2011 実施状況報告書

URL: 

公開日: 2011-08-05   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi