研究課題/領域番号 |
19KK0286
|
研究種目 |
国際共同研究加速基金(国際共同研究強化(A))
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京都立大学 |
研究代表者 |
小町 守 東京都立大学, システムデザイン研究科, 教授 (60581329)
|
研究期間 (年度) |
2020 – 2023
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
12,610千円 (直接経費: 9,700千円、間接経費: 2,910千円)
|
キーワード | 言語学習 / 文法誤り訂正 / 深層学習 / 事前学習モデル / 疑似誤り / 言語学習支援 / 自然言語処理 |
研究開始時の研究の概要 |
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。
|
研究実績の概要 |
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。
渡航前には本研究室でこれまでに使っている Lang-8 コーパスを中心に英語の擬似誤りを用いた研究に取り組み、渡航後にはケンブリッジ大学が保有する大規模な Cambridge Learner Corpus を活用した研究を行う予定です。また、現在使われているデータ以外のコーパスについても、英語については様々な分野のジャンルが含まれるように、そしてそれ以外の言語についてもカバーしていくように、評価用・訓練用含めて拡充していく計画です。
2022年度は、2021年度中に投稿して採択されていた国際会議の発表を2件行いました(オンライン発表です)。また、中国語の文法誤り訂正に疑似誤りを用いた事前学習モデルを適用する手法に関する研究が国際論文誌に採択されました。現在は、中国語文法誤り訂正の評価手法のメタ評価に関する研究に取り組んでいます。そして、日本語学習者がどのような誤りを犯すのかについてのタグを付与したコーパスを作成した研究が論文誌に採択されました。最後に、英語文法誤り検出のフィードバックコメント生成の研究に取り組みました。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究発表については、中国語での文法誤り訂正タスクにおいて提案するような学習者の誤り傾向を疑似データ作成に反映する研究が論文誌に採択され、順調に進展しています。
渡航計画については、COVID-19 の感染状況を鑑み、採択時に予定していた2020年度の出発を2021年度に変更したのですが、さらに感染状況が収束しなかったので、2023年度の2023年5月-2024年2月の渡航に変更したため、当初より遅れており、研究期間の延長願を提出しました。一方、この渡航計画変更については2022年度当初の段階で 2022年度当初からは変わっておらず、2023年度は計画通り渡航予定です。
|
今後の研究の推進方策 |
文法誤り訂正の研究については、今後は大規模言語モデル(基盤モデル)を用いた研究に取り組んでいく予定です。
渡航計画については現在の予定では2023年6月から2024年の2月にかけて渡航する計画です。2023年5月現在、渡航先の外国機関(ケンブリッジ大学)からも承認が降り、ビザの申請中で、ビザが下り次第渡英します。
|