• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

マルチチャンネル最小二乗平均を用いた複数話者の発話に頑健なハンズフリー音声認識

研究課題

研究課題/領域番号 22700169
研究種目

若手研究(B)

配分区分補助金
研究分野 知覚情報処理・知能ロボティクス
研究機関長岡技術科学大学 (2012)
静岡大学 (2010-2011)

研究代表者

王 龍標  長岡技術科学大学, 産学融合トップランナー養成センター, 産学融合特任准教授 (30510458)

研究期間 (年度) 2010 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2012年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2011年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2010年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード一般化スペクトルサブトラクション / ハンズフリー音声認 / missing feature theory / マルチチャンネルLMS / ブラインド残響除去 / ハンズフリー音声認識 / 音源分離 / 独立成分分析
研究概要

遠隔環境下で音の生成を定式化し、伝送路の伝達特性を自動的に推定し、様々な残響環境に対して頑健な残響除去および残響除去の信頼性を用いる後処理を行い、高精度な残響処理を実現した。また、パワースペクトル減算(SS)の代わりに,一般化SSを用いたブラインド残響除去法を提案し,パワーSSに基づくブラインド残響除去法に対してエラー率が大幅に削減できた。さらに、実環境(会議室)の残響を含んだ音声を収録し評価に用いた。人工残響音声と同程度のエラー削減率を達成した。なお、非定常雑音である音楽を含む残響音声に対して,本提案のマルチチャンネル最小二乗平均を基づく一般化スペクトルサブトラクション(GSS)によるブラインド残響除去法とICA(独立成分分析)に基づくブラインド音源分離を組み合わせる方法を提案しました。

報告書

(4件)
  • 2012 実績報告書   研究成果報告書 ( PDF )
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (48件)

すべて 2013 2012 2011 2010 その他

すべて 雑誌論文 (7件) (うち査読あり 2件) 学会発表 (34件) (うち招待講演 1件) 図書 (4件) 備考 (3件)

  • [雑誌論文] Speaker identification and verification by combining MFCC and phase information2012

    • 著者名/発表者名
      S. Nakagawa, L. Wang and S. Ohtsuka
    • 雑誌名

      IEEE Transactions on Audio, Speech and Language Processing

      巻: Vol.20, No.4 号: 4 ページ: 1085-1095

    • DOI

      10.1109/tasl.2011.2172422

    • 関連する報告書
      2012 実績報告書 2012 研究成果報告書
  • [雑誌論文] Dereverberation and Denoising Based on Generalized Spectral Subtraction by Multi-channel LMS Algorithm Using a Small-scale Microphone Array2012

    • 著者名/発表者名
      L. Wang, K. Odani and A. Kai
    • 雑誌名

      Eurasip Journal on Advanced in Signal Processing

      巻: 2012 号: 1

    • DOI

      10.1186/1687-6180-2012-12

    • 関連する報告書
      2012 研究成果報告書 2011 実績報告書
  • [雑誌論文] Identification of a distant speaker and its robustness2011

    • 著者名/発表者名
      Y. Jiang, Z. Tang and L. Wang
    • 雑誌名

      Chinese Journal of Electronics

      巻: Vol.20, No.2 ページ: 278-282

    • URL

      http://www.ejournal.org.cn/Jweb_cje/EN/abstract/abstract1109.shtml

    • 関連する報告書
      2012 研究成果報告書 2011 実績報告書
  • [雑誌論文] Distant-talking speech recognition based on spectral subtraction by multi-channel LMS algorithm2011

    • 著者名/発表者名
      L. Wang, N. Kitaoka, S. Nakagawa
    • 雑誌名

      IEICE Trans. on Information and Systems

      巻: Vol.E94-D, No.3 ページ: 659-667

    • URL

      http://search.ieice.org/bin/summary.php?id=e94-d_3_659

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Distant-talking speech recognition based on spectral subtraction by multi-channel LMS algorithm2011

    • 著者名/発表者名
      L.Wang, N.Kitaoka, S.Nakagawa
    • 雑誌名

      IEICE Trans.on Information and Systems

      巻: Vol.E94-D, No.3 ページ: 659-667

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Speaker recognition by combining MFCC and phase information in noisy conditions2010

    • 著者名/発表者名
      L. Wang, K. Minami, K. Yamamoto, S. Nakagawa
    • 雑誌名

      IEICE Trans. on Information and Systems

      巻: Vol.E93-D,No.9 ページ: 2397-2406

    • URL

      http://search.ieice.org/bin/summary.php?id=e93-d_9_2397

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Speaker recognition by combining MFCC and phase information in noisy conditions2010

    • 著者名/発表者名
      L.Wang, K.Minami, K.Yamamoto, S.Nakagawa
    • 雑誌名

      IEICE Trans.on Information and Systems

      巻: Vol.E93-D, No.9 ページ: 2397-2406

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [学会発表] Single-sided Approach to Discriminative PLDA Training for Text-Independent SpeakerVerification2013

    • 著者名/発表者名
      Zhaofeng Zhang、Lee Kong Aik、LongbiaoWang、Atsuhiko Kai、Ma Bin
    • 学会等名
      Proc. of the 2013 SpringMeeting of the ASJ
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Single-sided Approach to Discriminative PLDA Training for Text-Independent Speaker Verification2013

    • 著者名/発表者名
      Z. Zhang、L. Lee、L. Wang、A. Kai、B. Ma
    • 学会等名
      日本音響学会2013年春季研究発表会
    • 発表場所
      東京工科大学八王子キャンパス(東京都)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 話者認識技術の現状と課題2013

    • 著者名/発表者名
      網野加苗、石原俊一、小川哲司、長内隆、黒岩眞吾、越仲孝文、篠田浩一、柘植覚、、西田昌史、松井知子、王龍標
    • 学会等名
      音声研究会
    • 発表場所
      大同大学(愛知県)
    • 関連する報告書
      2012 実績報告書
    • 招待講演
  • [学会発表] 音声認識誤り率の推定を用いたPOMDPモデルの構築の検討2012

    • 著者名/発表者名
      西島祥悟、甲斐充彦、小暮悟、王龍標
    • 学会等名
      第64回言語・音声理解と対話処理研究会
    • 発表場所
      東京大学本郷キャンパス(東京)
    • 年月日
      2012-03-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 話者や発話固有の特徴の違いに注目した認識性能の個人差の要因分析2012

    • 著者名/発表者名
      赤尾佳彦、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2012年春季研究発表会講演論文集
    • 発表場所
      神奈川大学横浜キャンパス(横浜)
    • 年月日
      2012-03-15
    • 関連する報告書
      2011 実績報告書
  • [学会発表] SS法に基づくブラインド残響除去法の実環境音声における評価2012

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2012年春季研究発表会講演論文集
    • 発表場所
      神奈川大学横浜キャンパス(横浜)
    • 年月日
      2012-03-13
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Distant-talking speaker identification using a reverberation model with various artificial room impulse responses2012

    • 著者名/発表者名
      L. Wang, Z. Zhang, A. Kai and Y. Kishi
    • 学会等名
      Proc. of APSIPA ASC 2012
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Dereverberantion based on Generalized Spectral Subtraction for Distant-talking Speaker Recognition2012

    • 著者名/発表者名
      Z. Zhang, L. Wang and A. Kai
    • 学会等名
      Proc. of APSIPA ASC 2012
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] On the Use of Phase Information-based Joint Factor Analysis for Speaker Verification under Channel Mismatch Condition2012

    • 著者名/発表者名
      Y. Hirano, L. Wang, A. Kai and S.Nakagawa
    • 学会等名
      Proc. of APSIPA ASC 2012
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Speech Recognition by Denoising and Dereverberation Based on Spectral Subtraction in a Real Noisy Reverberant Environment2012

    • 著者名/発表者名
      K. Odani, L. Wang and A. Kai
    • 学会等名
      Proc. of Interspeech 2012
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 音声ツイートを想定したtwitterクライアントの試作・評価と発話特徴の利用に関する一考察2012

    • 著者名/発表者名
      進士智也、甲斐充彦、王龍標、小暮悟
    • 学会等名
      第14回 音声言語シンポジウム
    • 発表場所
      東京工業大学大岡山キャンパス(東京都)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 音響情報と空間情報の利用によるSpeaker Diarizationの検討2012

    • 著者名/発表者名
      倉島 諒、兼子 史聖、王 龍標、甲斐 充彦
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学 (長野県)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 一般化スペクトルサブトラクションによる残響除去法を用いた遠隔発話話者認識2012

    • 著者名/発表者名
      張 兆峰、奥 和紀、小谷 恭平、王 龍標、甲斐 充彦
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学 (長野県)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] MFCC と位相情報を用いたJoint Factor Analysis によるチャネルミスマッチ条件下での話者照合2012

    • 著者名/発表者名
      平野郁也、王龍標、甲斐充彦、中川聖一
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学 (長野県)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 音楽重畳音声を用いた音源分離と残響除去法の評価2012

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2012年秋季研究発表会
    • 発表場所
      信州大学 (長野県)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] SS法に基づく雑音残響除去法の実環境下における評価2012

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      電子情報通信学会技術研究報告
    • 発表場所
      大阪大学中之島センター(大阪府)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 単語断片の候補選択が可能な音声入力インタフェースの実装と評価2011

    • 著者名/発表者名
      張用起、甲斐充彦、王龍標
    • 学会等名
      音声言語情報処理研究会
    • 発表場所
      芝浦工業大学(東京)
    • 年月日
      2011-12-20
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Blind Dereverberation Based on Generalized Spectral Subtraction by Multi-channel LMS Algorithm2011

    • 著者名/発表者名
      K.Odani, L.Wang, A.Kai
    • 学会等名
      APSIPA ASC 2011
    • 発表場所
      Grand New World Hotel Xi'an (Xi'an, China)
    • 年月日
      2011-10-20
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 複数の人工室内インパルス応答を用いた残響モデルの利用による遠隔発話話者認識2011

    • 著者名/発表者名
      王龍標、岸良樹、張兆峰、甲斐充彦
    • 学会等名
      日本音響学会2011年秋季研究発表会講演論文集
    • 発表場所
      島根大学(島根県)
    • 年月日
      2011-09-21
    • 関連する報告書
      2011 実績報告書
  • [学会発表] SS法に基づくブラインド残響除去法による雑音残響下音声認識2011

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2011年秋季研究発表会講演論文集
    • 発表場所
      島根大学(島根県)
    • 年月日
      2011-09-21
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Evaluation of hands-free large vocabulary continuous speech recognition by blind dereverberation based on spectral subtraction by multi-channel LMS algorithm2011

    • 著者名/発表者名
      L.Wang, K.Odani, A.Kai
    • 学会等名
      International conference on Text, Speech and Dialogue 2011
    • 発表場所
      University of West Bohemia (Pilsen, Czech Republic)
    • 年月日
      2011-09-05
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 遠隔音声認識のためのマルチチャンネルLMSアルゴリズムによる残響除去法の改善2011

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      電子情報通信学会技術研究報告
    • 発表場所
      立命館大学大阪キャンパス(大阪府)
    • 年月日
      2011-05-12
    • 関連する報告書
      2011 実績報告書
  • [学会発表] マルチチャンネルLMSアルゴリズムに基づくブラインド残響除去による大語彙音声認識の評価2011

    • 著者名/発表者名
      小谷恭平、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2011年春季研究発表会
    • 発表場所
      早稲田大学西早稲田キャンパス(東京都)
    • 年月日
      2011-03-10
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 人工残響モデルで模擬した環境の違いによる遠隔発話話者認識への影響分析2011

    • 著者名/発表者名
      岸良樹、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2011年春季研究発表会
    • 発表場所
      早稲田大学西早稲田キャンパス(東京都)
    • 年月日
      2011-03-10
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Blind Dereverberation Based on Generalized Spectral Subtraction by Multi-channel LMS Algorithm2011

    • 著者名/発表者名
      Kyohei Odani, Longbiao Wang and Atsuhiko Kai
    • 学会等名
      Proc. of APSIPA ASC 2011
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Evaluation of Hands-free Large Vocabulary Continuous Speech Recognition by Blind Dereverberation Based onSpectral Subtraction by Multi-channelLMS Algorithm2011

    • 著者名/発表者名
      Longbiao Wang , Kyohei Odani and Atsuhiko Kai
    • 学会等名
      Proc. of Text, Speech and Dialogue
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Multimodal interface with N-best display including candidates of spoken word fragments2010

    • 著者名/発表者名
      Y.Jang, A.Kai, L.Wang
    • 学会等名
      APSIPA ASC 2010
    • 発表場所
      Biopolis, Singapore
    • 年月日
      2010-12-16
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Investigation of driving-behavior modeling for recognition of a driving situation2010

    • 著者名/発表者名
      J.Ema, L.Wang, A.Kai, T.Itoh
    • 学会等名
      APSIPA ASC 2010
    • 発表場所
      Biopolis, Singapore
    • 年月日
      2010-12-15
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Compensation approaches for distant Speaker identification under reverberant environments2010

    • 著者名/発表者名
      Y.Jiang, Z.Tang, L.Wang
    • 学会等名
      CCPR 2010
    • 発表場所
      Chongqing University, Chongqing, China
    • 年月日
      2010-10-23
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 車の運転状況の認識のための運転行動モデルの検討2010

    • 著者名/発表者名
      江間旬記、王龍標、甲斐充彦、伊藤敏彦
    • 学会等名
      電子情報通信学会 2010年度ソサエティ大会
    • 発表場所
      大阪府立大学(大阪府)
    • 年月日
      2010-09-16
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 単語断片を含む複数候補の動的構成によるマルチモーダル単語入力インタフェース2010

    • 著者名/発表者名
      張用起、甲斐充彦、王龍標
    • 学会等名
      日本音響学会2010年秋季研究発表会
    • 発表場所
      関西大学(大阪府)
    • 年月日
      2010-09-16
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 人工残響モデルを用いた環境の違いに頑健な遠隔発話話者認識の検討2010

    • 著者名/発表者名
      岸良樹、王龍標、甲斐充彦
    • 学会等名
      日本音響学会2010年秋季研究発表会
    • 発表場所
      関西大学(大阪府)
    • 年月日
      2010-09-14
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Multimodal interface with N-best display including candidates of spoken word fragments2010

    • 著者名/発表者名
      Y. Jang, A. Kai and L. Wang
    • 学会等名
      Proc. of APSIPA ASC2010
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Compensation approaches for distant Speaker identification under reverberant environments2010

    • 著者名/発表者名
      Y. Jiang, Z. Tang and L. Wang
    • 学会等名
      Proc. of CCPR 2010
    • 関連する報告書
      2012 研究成果報告書
  • [図書] Dereverberation Based on Spectral Subtraction by Multi-channel LMS Algorithm for Hands-free Speech Recognition2012

    • 著者名/発表者名
      Longbiao Wang, Kyohei Odani, Atsuhiko Kai, Norihide Kitaoka and Seiichi Nakagawa
    • 出版者
      Chapter in Modern Speech Recognition Approaches with Case Studies, S. Ramakrishnan (Eds.), IN-TECH
    • 関連する報告書
      2012 研究成果報告書
  • [図書] “Dereverberation Based on Spectral Subtraction by Multi-channel LMS Algorithm for Hands-free Speech Recognition”, Chapter in Modern Speech Recognition Approaches with Case Studies, S. Ramakrishnan (Eds.)2012

    • 著者名/発表者名
      L. Wang, K. Odani, A. Kai, N. Kitaoka and S. Nakagawa
    • 出版者
      IN-TECH
    • 関連する報告書
      2012 実績報告書
  • [図書] Evaluation of hands-free large vocabulary continuous speech recognition by blind dereverberation based on spectral subtraction by multi-channel LMS algorithm2011

    • 著者名/発表者名
      Longbiao Wang, Kyohei Odani and Atsuhiko Kai
    • 出版者
      Ivan Habernal, Vaclav Matousek (Eds.), Lecture Notes in Artificial Intelligence, Springer LNAI6836
    • 関連する報告書
      2012 研究成果報告書
  • [図書] (章節)"Evaluation of hands-free large vocabulary continuous speech recognition by blind dereverberation based on spectral subtraction by multi-channel LMS algorithm" in LNAI 6836, Text, Speech and Dialogue2011

    • 著者名/発表者名
      L.Wang, K.Odani, A.Kai
    • 総ページ数
      8
    • 出版者
      Springer-Verlag Verlin Heidelberg
    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://sip.nagaokaut.ac.jp/wang-j.html

    • 関連する報告書
      2012 研究成果報告書
  • [備考]

    • URL

      http://ssp.sys.eng.shizuoka.ac.jp/wang-j.html

    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://ssp.sys.eng.shizuoka.ac.jp/wang-j.html

    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi