研究課題/領域番号 |
15K12063
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知覚情報処理
|
研究機関 | 京都大学 |
研究代表者 |
吉井 和佳 京都大学, 情報学研究科, 講師 (20510001)
|
連携研究者 |
河原 達也 京都大学, 大学院情報学研究科, 教授 (00234104)
持橋 大地 統計数理研究所, モデリング研究系, 准教授 (80418508)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
キーワード | 音源分離 / 音声認識 / 確率モデル / ベイズモデル / MCMC |
研究成果の概要 |
本研究では、音源分離を確率的に統合した同時発話音声認識を行う手法を提案した。音源分離により復元される音声信号には不確実性が存在するため、音声信号の事後分布を考慮することで音声認識との統合を行う。これにより、復元すべき音声を一意に定めることなく混合音から直接認識結果を得ることが可能となった。また、音の重畳過程と音源モデルを内包する統合モデルにより、高精度な音源分離を行う手法を考案した。具体的には、重畳過程・音源モデルに対して、混合モデル (LDA) および因子モデル (NMF) のそれぞれのモデル化を行うことで、各モデルの音源分離性能を比較評価した。
|
自由記述の分野 |
統計的音響信号処理
|