研究概要 |
今年度は,SATを用いて精度を高めたバイリンガル音響モデルを用いて,日本語話者の英語発声の発音誤りを検出する手法を開発した.従来のバイリンガル音響モデルを用いた発音評価法では,あらかじめ予測された誤りを含むモデルと誤りを含まないモデルの2つのモデルを使って学習者の発声をスコア付けし,その差によって発音評価を行っている.このとき,スコア差があらかじめ決められた閾値を超えるかどうかで発音誤りを検出していた.しかし,ある発音が誤りと判断されるかどうかは,その発音の種類や音素の環境などに影響される.そこで,誤りの種類と誤り候補となる音素の環境を決定木によってクラスタリングし,そのクラスタごとに最適な誤り判定閾値を設定する方法を開発した.この方法では,当該音素およびその前後の音素,誤りの種類に関する質問を準備し,それぞれの質問でデータを2分割した時の最適な閾値をすべて計算する.このときに最も誤り検出精度の高い質問を選択してデータを最終的に2つに分ける.次に,2つに分けたデータのそれぞれをまた別の質問で分割し,これを再帰的に繰り返すことで判定精度を向上させる.実験の結果,従来手法の発音誤り検出精度が64%であるのに対し,提案法は90%の精度を得ることができた. 次に,日本人の英語発話について,作成した文法誤りルールに基づき,実際の発話から文法誤りを検出する方法について検討した.日本人の英作文コーパス(SSTコーパス)から誤りルールを自動的に抽出し,正解文章に対してルールを適用することで,文法誤り発話を受理する有限オートマトンを生成する.そのオートマトンを用いて入力音声を認識することで,誤りを含んだ英語発話を認識することができる.実験の結果,認識した単語列と実際の(誤りを含む)発話との一致度は64%であり,十分な性能は得られなかった.今後さらに検討を要する.
|