音声認識において、言語モデルの貢献を度外視した場合には、音素単位では認識率が悪くなる可能性は観測されたが、特定の音素系列において統計的に有意なレベルで認識率が悪化することはないことがわかった。一方で、話者認識・話者識別においては、言語モデルを利用しないのが一般的であるため、単語認識と同様の問題が生じることがわかった。さらに、話者識別のほとんどの応用では、学習データを十分に得ることが期待できない。さらに認識対象の音素系列を事前に想定できないことも多く、音声認識より高性能化が難しい問題であることが明らかになった。
|