2018 Fiscal Year Annual Research Report
Grammatical Error Correction using Robust Word Representation Learning and Deep Neural Networks
Project/Area Number |
16K16117
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
小町 守 首都大学東京, システムデザイン研究科, 准教授 (60581329)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 単語分散表現 / 深層言語表現 / 文法誤り検出 / 文法誤り訂正 / 機械翻訳 / 深層学習 |
Outline of Annual Research Achievements |
本年度は、正誤情報と文法誤りパターンを考慮した単語分散表現を用いた文法誤り検出の研究が言語処理学会論文誌に採択された。また、大規模なコーパスから学習された BERT と呼ばれる深層言語表現を適用することで、英語の文法誤り検出で世界最高精度を達成し、自然言語処理の中堅国際会議である International Conference on Computational Linguistics and Intelligent Text Processing (CICLing) に投稿して採択された。また、英文法誤り訂正の共通タスクである BEA 2019 Shared Task on Grammatical Error Correction において、学習者コーパスに制限があるタスクと、学習者コーパスを使わないタスクに参加した。 日本語や中国語における頑健な言語表現の学習のために、単語を文字そして部首に分解して言語表現を学習する手法を提案し、日中・中日ニューラル機械翻訳タスクで有効性を示し、械翻訳のトップ国際会議である Conference on Machine Translation に投稿して採択された。同手法はさらに通常のニューラル機械翻訳だけでなく、教師なしニューラル機械翻訳においても有効であることを検証し、成果を Workshop on Asian Translation で発表するとともに、arXiv にて公開した。 一方、日本語の誤り検出・訂正の研究にも取り組み、日本語学習者のための誤用検索システムに文法誤り検出を組み込んだシステムの有効性を示し、言語処理学会年次大会で発表し、国際会議に投稿中である。また、日本語ネイティブが書いた文章の誤り検出にも取り組み、擬似誤りコーパスを作成する手法の同音異義語および助詞誤り検出における有効性を示し、人工知能学会全国大会に投稿した。
|
Research Products
(9 results)