研究概要 |
統合的言語モデルと,音響モデル双方のモデル化精度の向上に取り組んだ。言語モデルについて,単語クラスに基づく言語モデルを作成し,辞書に出現しない未知の単語へその出現確率を付与する方法を検討した。単語クラス言語モデルを用いて確率を平滑化した後,未知語を単語クラスに割り振り均等な出現確率を与える方法により,未知語を含んだ音声の認識率を最大10%程度向上させることができることを確認した。言語モデルの学習に際しては,形態素解析ツール茶筅の品詞体系に準じた単語クラスを採用することが有効であることも確認した。 一方音響モデルについては帯域不使用HMMの選択に基づくモデル化を検討した。雑音の影響が狭帯域に集中する場合,雑音の影響が強い帯域以外では,音声の情報が残っている。そこで,雑音の音声のスペクトクルの情報が失われてしまった周波数帯域以外の帯域のスペクトル情報を用いて認識を行う方法を考案した。実際には観測されたスペクトルのどの帯域に雑音の影響が強いかは未知である。そこで本研究では観測スペクトルをいくつかの帯域に分割し,それぞれの帯域のスペクトル情報が失われていると仮定しそれぞれ対応したモデルで認識し,認識結果から何らかの方法でモデル選択を行うことで高い精度を持つモデル化を行うことができる
|