本研究の目的は、大規模な言語リソース用いた誤り訂正およびそれを用いた日本語学習支援システムの開発である。本研究で用いる手法で捉えられる学習者の誤りを明らかにし、また実際に日本語学習支援システムを学習者に使用してもらうことで、提案する手法を用いたシステムの学習効果を明らかにすることである。本研究で行うことは大きく分けて以下の3つであった。(1) 係り受け、構文情報を用いた統計的機械翻訳による誤り訂正と誤り訂正ルールの獲得、(2) 母語による誤り傾向の獲得、(3) 日本語学習支援システムの開発 本年度の実施した範囲では、実際に日本語学習支援システムの開発を行ない、学習効果を明らかにするまでは至らなかった。 昨年度の研究で係り受け、構文情報を考慮した統計的機械翻訳を使った文法誤り訂正の手法で訂正結果が良くならないことが判明した。本年度は、機械翻訳を使った文法誤り訂正システムが複数の訂正結果を出力できることに着眼した。複数の訂正結果の中を見ると、1つだけ訂正を出力した場合よりも良い訂正が含まれていた。そこで、この複数の訂正結果から一番良い訂正結果を選ぶ、リランキングと呼ばれる手法の構築を行なった。このリランキングの手法では先にあげた係り受け、構文情報も考慮することが可能である。昨年度同様、日本語では、学習者の書いた文に対する単語分割に失敗するという問題があるため、英語を対象として実験を行なった。その結果、係り受け、構文情報を考慮することで訂正性能が改善した。 また、大規模学習者コーパスからの母語訳付き学習者コーパスの作成も行なった。本研究で用いているコーパスの中には、学習言語による作文に対して母語訳が併記されているものがある。そこで母語が併記された学習者の文を自動で抽出する手法を提案した。母語訳が付いているもの以外も抽出しているところがあるため、今後さらなる改善が必要である。
|