2019 Fiscal Year Annual Research Report
学習者のライティングレベルを考慮した自動英語文法誤り訂正
Project/Area Number |
19J14084
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
金子 正弘 首都大学東京, 大学院システムデザイン研究科, 特別研究員(DC2)
|
Project Period (FY) |
2019-04-25 – 2021-03-31
|
Keywords | 文法誤り訂正 |
Outline of Annual Research Achievements |
初年度の目的は言語学習者のためにより効果的な文法誤り訂正訂正システムを構築することである.そのために,BERTを用いた文法誤り訂正モデルの研究を行った.BERTは大規模データで学習された言語表現であり様々な自然言語処理タスクで性能改善に貢献している.一方で,BERTを文法誤り訂正モデルに用いるためには,以下2つの問題がある.(1)文法誤り訂正でファインチューニングすることで,事前学習された有益な情報を破壊的忘却してしまう問題(2)BERTの事前学習時は正文データが使われているが,文法誤り訂正は誤文が入力として与えられる.そのため,事前学習時と対象タスクでデータにギャップがありBERTの情報を十分に活かすことができない.これらの問題を解決するために,BERTを学習者データでファインチューニングし素性として文法誤り訂正に与える手法を提案した.学習者データでファインチューニングすることで問題(1)を解決する.さらに,素性として用いることで問題(2)を解決する.その結果,英語の文法誤り訂正において世界最高精度を達成した.さらに,提案手法を用いることでBERTが正文と誤文を区別して学習するようになることを示した.本研究の成果は自然言語処理の最難関国際会議58th Annual Conference of the Association for Computational Linguisticsに採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
文法誤り訂正の性能向上を目的とし,提案手法を用いることで世界最高精度を達成することを示したためおおむね順調に進展しているといえる.そして,自然言語処理における最難関国際会議に論文が採択されている.
|
Strategy for Future Research Activity |
今後はさらに高性能な文法誤り訂正システムの実現を目指す.そのために,BERTだけでなく疑似データを用いた文法誤り訂正について調査を行う.
|