2021 Fiscal Year Research-status Report
言語学習者の誤用に注目した単語と文の分散表現の獲得と分析
Project/Area Number |
19KK0286
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
小町 守 東京都立大学, システムデザイン研究科, 教授 (60581329)
|
Project Period (FY) |
2020 – 2022
|
Keywords | 文法誤り訂正 / 言語学習支援 / 深層学習 |
Outline of Annual Research Achievements |
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。
渡航前には本研究室でこれまでに使っている Lang-8 コーパスを中心に英語の擬似誤りを用いた研究に取り組み、渡航後にはケンブリッジ大学が保有する大規模な Cambridge Learner Corpus を活用した研究を行う予定です。また、現在使われているデータ以外のコーパスについても、英語については様々な分野のジャンルが含まれるように、そしてそれ以外の言語についてもカバーしていくように、評価用・訓練用含めて拡充していく計画です。
2021年度は昨年度中に投稿して採択されていた国際会議の発表を行いました。また、日本語学習者の文法誤り訂正の研究で論文誌に投稿し、採択されました。そして、多言語のデータの文法誤り訂正で、他の言語における誤り方の文法知識がどのように転移するかを検討した研究を論文誌に投稿し、採択されました。中国語の文法誤り訂正についても、事前学習言語モデルを用いた文法誤り訂正についてまとめて論文誌に投稿中です。一方、データ作成については英語の文法誤り訂正システムの品質推定のための習熟度別のデータセット作成と、日本語の文法誤り訂正システムの品質推定のためのデータセット作成の2つに取り組み、国際会議に投稿して採択されました。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
研究発表については、英語や日本語を含む多言語での文法誤り訂正タスクにおいて提案するような学習者の誤り傾向を反映する研究が論文誌や国際会議に採択され、順調に進展しています。
一方、当初に予定していた渡航計画については、学内でのサバティカルの2回目の調整も済んでいたにもかかわらず、新型コロナウイルスの感染拡大が収まらず再度の渡航計画の変更を余儀なくされ、サバティカルの取得期間を2020年9月-2021年8月から2021年9月-2022年8月に変更したにも関わらず、再度2023年5月-2024年2月に変更せざるを得なくなりました。このため、国際共同研究部分の開始が遅れています。
|
Strategy for Future Research Activity |
文法誤り訂正の研究については、今後は大規模な事前学習済み言語モデルを用いた研究に取り組んでいく予定です。
渡航計画については新型コロナウイルスの感染拡大状況やワクチンの接種状況を随時確認しながら具体的な渡航時期の決定を行う予定ですが、2022年度中には渡航しないことを決め、現在の予定では2023年の5月から2024年の2月にかけて渡航する計画です。
|
Research Products
(12 results)