2022 Fiscal Year Research-status Report
言語学習者の誤用に注目した単語と文の分散表現の獲得と分析
Project/Area Number |
19KK0286
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
小町 守 東京都立大学, システムデザイン研究科, 教授 (60581329)
|
Project Period (FY) |
2020 – 2023
|
Keywords | 言語学習 / 文法誤り訂正 / 深層学習 / 事前学習モデル / 疑似誤り |
Outline of Annual Research Achievements |
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。
渡航前には本研究室でこれまでに使っている Lang-8 コーパスを中心に英語の擬似誤りを用いた研究に取り組み、渡航後にはケンブリッジ大学が保有する大規模な Cambridge Learner Corpus を活用した研究を行う予定です。また、現在使われているデータ以外のコーパスについても、英語については様々な分野のジャンルが含まれるように、そしてそれ以外の言語についてもカバーしていくように、評価用・訓練用含めて拡充していく計画です。
2022年度は、2021年度中に投稿して採択されていた国際会議の発表を2件行いました(オンライン発表です)。また、中国語の文法誤り訂正に疑似誤りを用いた事前学習モデルを適用する手法に関する研究が国際論文誌に採択されました。現在は、中国語文法誤り訂正の評価手法のメタ評価に関する研究に取り組んでいます。そして、日本語学習者がどのような誤りを犯すのかについてのタグを付与したコーパスを作成した研究が論文誌に採択されました。最後に、英語文法誤り検出のフィードバックコメント生成の研究に取り組みました。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究発表については、中国語での文法誤り訂正タスクにおいて提案するような学習者の誤り傾向を疑似データ作成に反映する研究が論文誌に採択され、順調に進展しています。
渡航計画については、COVID-19 の感染状況を鑑み、採択時に予定していた2020年度の出発を2021年度に変更したのですが、さらに感染状況が収束しなかったので、2023年度の2023年5月-2024年2月の渡航に変更したため、当初より遅れており、研究期間の延長願を提出しました。一方、この渡航計画変更については2022年度当初の段階で 2022年度当初からは変わっておらず、2023年度は計画通り渡航予定です。
|
Strategy for Future Research Activity |
文法誤り訂正の研究については、今後は大規模言語モデル(基盤モデル)を用いた研究に取り組んでいく予定です。
渡航計画については現在の予定では2023年6月から2024年の2月にかけて渡航する計画です。2023年5月現在、渡航先の外国機関(ケンブリッジ大学)からも承認が降り、ビザの申請中で、ビザが下り次第渡英します。
|
Research Products
(7 results)