研究課題
本研究では,言語形態論のうち,言語コーパスに基づく統語構造学習モデルと意味構造学習モデルを統合した総合的形態論に基づく言語モデルを構築し,第二言語習得者のための言語習得支援に活用することを目的とする.令和4年度に第1の課題である統語構造を獲得する学習法の改良を検討し,文法誤り訂正モデルの学習に用いる人工訓練データを再構成することにより,モデルの文法誤り訂正能力を向上させることに成功した.これにより,第二言語学習者が作成した文章に対して,誤り訂正能力が向上した文法誤り訂正モデルを実現した.令和5年度は,引き続き,人工訓練データに関して,2種類の人工訓練データと提案手法による再構成訓練データの文法誤り種別に対する統計的性質が,第二言語学習者が起こしがちな文法誤り種別に関する統計的性質とどれくらい類似しているかを調べ,人工訓練データの品質を評価し,適切な学習法の指針を示した.さらに,第2の課題について,文章から抽象意味表現(AMR)を生成する学習モデルを訓練データLDC2020T02を用いて学習したが,従来手法を改善することはできなかった.第3の課題について,提案した学習法による文法誤り訂正モデルに抽象表現を処理するアテンションモデルを並列独立に付加し,統語構造学習モデルと意味構造学習モデルを統合した文法誤り訂正モデルを構築した.しかしながら,文法誤り訂正能力は,統合前の文法誤り訂正モデルと同程度であり,意味構造学習モデルを付加することによる明白な改善は見られなかった.第4の課題について,第二言語学習者が英文を入力すると,提案した文法誤り訂正モデルにより文法誤りを指摘し,同時に,Wordnetデータベースから単語の概念と同義語を表示するアプリケーションを開発した.この成果は,第二言語学習者の支援に寄与するものである.
すべて 2023
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件)
Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023)
巻: - ページ: 455-465
10.18653/v1/2023.bea-1.38