研究概要 |
本年度は,日本人による英語発話からの文法誤り検出の高精度化について検討した.まず,日本人英語音声の認識を高精度化するため,発話者レベル別の音響モデル学習について検討した.音響モデル学習に用いる学習用音声(ERJデータベース中の95名分,約21万単語)を発話者の英語レベル別に均等に3つに分け,それぞれについてモノフォン音響モデルを学習する.HMMの混合数を512混合まで増加させたところ,少い混合数では分割学習の効果が高かったが,256混合以上では分割せずに学習した場合と同等以下の性能であった.これは,パラメータ数に対する学習データ数が少ないためであると考えられた.そこで,学習データの減少を補うため,MLLR話者適応を繰り返し適用する.この方法により,混合数が多い場合でも分割学習の効果により認識性能を改善することができた. さらに,誤り指摘の精度を向上させるための基礎的な方法として,学習者の発話が想定される正解文と一致するのかどうかを識別する方法を開発した.従来は学習者発話を一旦認識し,その内容と正解文を比較して誤りを指摘していたが,提案法ではまず発話が誤りを含むのかどうかをいったん識別し,誤りがあると識別された場合のみ音声認識を行って誤りの指摘を行う.識別には,音声認識の尤度と正解文の強制アラインメントによる尤度の差を利用する.提案法により,単語正解精度は1.0ポイント上昇し,また誤り指摘の性能を示すF値は0.032(パーセント表示で3.2ポイント)改善した.
|