音声認識では発声された内容を一義的に決めることはきわめて困難であり、音響的に似通った数多くの認識仮説が生成されてしまう。これらの多くの仮説をランク付けするためには、音響的な尤度だけではなく、言語的な尤度をも考慮する必要がある。本研究では、確率、統計的な言語情報を用いた言語的尤度について研究した。特に、確率文脈自由文法と生成規則適用のマルコフ連鎖を用いたモデルについて、モデルのパラメータ推定、音声認識との統合について研究を行なった。これらの確率・統計的言語モデルを、LRパ-ザとHMM音韻認識を用いた音声認識システムに組み込み、日本語の文認識において評価を行なった。確率・統計的言語情報を用いることにより、文認識率を約20%程度向上させることができ、我々の用いたモデルの有効性を調べることができた。 通常の確率・統計的な言語モデルでは、単語間の連鎖確率等の局所的な制約しか利用していない。定型的な表現や慣用的な表現を言語モデルに組み込むことより、精度の高いモデルが構築できる可能性がある。本研究では、このような言語モデルの研究の第1段階として、コーパスから定型的な表現を自動的に抽出する研究を行なった。定型表現を自動抽出する方法として、相互情報量を用いる方法と仕事量基準を用いる方法を比較し、相互情報量はタスクに依存した複合名詞句の抽出に適し、仕事量基準はタスクに依存しない述語的な表現の抽出に適していることを示した。
|