• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 研究成果報告書

混合音に対する複数同時発話認識のための統一的ベイズアプローチ

研究課題

  • PDF
研究課題/領域番号 15K12063
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知覚情報処理
研究機関京都大学

研究代表者

吉井 和佳  京都大学, 情報学研究科, 講師 (20510001)

連携研究者 河原 達也  京都大学, 大学院情報学研究科, 教授 (00234104)
持橋 大地  統計数理研究所, モデリング研究系, 准教授 (80418508)
研究期間 (年度) 2015-04-01 – 2017-03-31
キーワード音源分離 / 音声認識 / 確率モデル / ベイズモデル / MCMC
研究成果の概要

本研究では、音源分離を確率的に統合した同時発話音声認識を行う手法を提案した。音源分離により復元される音声信号には不確実性が存在するため、音声信号の事後分布を考慮することで音声認識との統合を行う。これにより、復元すべき音声を一意に定めることなく混合音から直接認識結果を得ることが可能となった。また、音の重畳過程と音源モデルを内包する統合モデルにより、高精度な音源分離を行う手法を考案した。具体的には、重畳過程・音源モデルに対して、混合モデル (LDA) および因子モデル (NMF) のそれぞれのモデル化を行うことで、各モデルの音源分離性能を比較評価した。

自由記述の分野

統計的音響信号処理

URL: 

公開日: 2018-03-22  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi