研究課題
挑戦的萌芽研究
音声言語処理に対し、従来の示量性統計理論を拡張した非示量性統計理論を適用する方法論を開発した。まず、音声認識のための特徴抽出について、周囲雑音・回線の違いから生じる変動に対し頑健な、q-log spectral mean subtraction (q-LMSN)手法を提案し、従来のCMNを用いた手法に比べ優位に性能が高いことを示した。また、音声認識・映像意味インデクシングにおいて、HMMやGMMの出力分布として、周囲雑音の変動に頑健なq-Gauss混合分布を用いる方式を提案し、その効果を確認した。
すべて 2014 2013 2012
すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (4件) (うち招待講演 1件)
Journal of Visual Communication and Image Representation
巻: 24 号: 8 ページ: 1450-1457
10.1016/j.jvcir.2013.10.005
120006582288
Speech Commuication
巻: 55 ページ: 587-599
120006582242