形態素解析などの自然言語処理技術を応用して、日本語学習者の作文練習を支援するシステムを開発した。具体的には、日本語学習者の作文から典型的な日本語の誤用例を収集して分類し、各分類の誤用を含む作文の形態素解析結果をもとに、自動的に誤用の箇所とその修正例を表示する作文添削システムを開発した。「表記」の誤用(特に片仮名語の表記)と「語彙」の誤用(特に母語の語彙を使った誤り)について、誤用箇所を特定し修正例を表示することが可能となり、また形態素解析エンジンが参照する辞書への誤用例の登録を進め、より多くの誤用を特定できるようになった。学習者ごとにどのような類型の誤用が多いかといった統計情報の分析に、行列の特異値分解等を応用した。一方、平仮名語の誤用を含む文を形態素解析すると、全体として不自然な解析結果が出力され、これをもとに誤用箇所の特定と修正例の表示を行うことは難しいことが明らかになった。今後、形態素解析エンジン自体に変更を加えるなどして、辞書に登録された語彙と濁点・半濁点・長音記号だけが異なる語彙などを自動的に判別できるようにすることにより、この問題を解決することができる。自動添削システムには、人間が行うようなレベルの添削は期待できないが、限られた数の教員では不可能な量の添削が可能になる上、逆に人間であれば見逃す可能性のある単純なミスを見逃さないといったメリットがあることが明らかになった。
|