意味構造と統語構造の統合学習を用いた文書作成支援アプリケーションの開発
Project/Area Number |
21K00806
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02100:Foreign language education-related
|
Research Institution | Kurume National College of Technology |
Principal Investigator |
小田 幹雄 久留米工業高等専門学校, 制御情報工学科, 教授 (80300648)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2023: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
|
Keywords | 言語モデル / 統語構造 / 意味構造 / 第二言語習得 / 統合構造 / 外国語教育 / 言語処理 |
Outline of Research at the Start |
本研究の概要は、統語構造学習モデルと意味構造学習モデルを統合した言語モデルを構築し、構築した言語モデルをコア技術として、英語を第二言語とする第二言語学習者が、第二言語で文章を作成する際に、オンライン上で、作成中の文章の統語構造と意味構造がわかり、かつ単語の意味上の関連性、前単語や次単語の候補の提示、文法上・意味上の誤りを指摘するWebベースの支援ソフトウエアを開発することである。
|
Outline of Annual Research Achievements |
本研究では,言語形態論のうち,言語コーパスに基づく統語構造学習モデルと意味構造学習モデルを統合した総合的形態論に基づく言語モデルを構築し,第二言語習得者のための言語習得支援に活用することを目的とする. 令和4年度に第1の課題である統語構造を獲得する学習法の改良を検討し,文法誤り訂正モデルの学習に用いる人工訓練データを再構成することにより,モデルの文法誤り訂正能力を向上させることに成功した.これにより,第二言語学習者が作成した文章に対して,誤り訂正能力が向上した文法誤り訂正モデルを実現した.令和5年度は,引き続き,人工訓練データに関して,2種類の人工訓練データと提案手法による再構成訓練データの文法誤り種別に対する統計的性質が,第二言語学習者が起こしがちな文法誤り種別に関する統計的性質とどれくらい類似しているかを調べ,人工訓練データの品質を評価し,適切な学習法の指針を示した. さらに,第2の課題について,文章から抽象意味表現(AMR)を生成する学習モデルを訓練データLDC2020T02を用いて学習したが,従来手法を改善することはできなかった.第3の課題について,提案した学習法による文法誤り訂正モデルに抽象表現を処理するアテンションモデルを並列独立に付加し,統語構造学習モデルと意味構造学習モデルを統合した文法誤り訂正モデルを構築した.しかしながら,文法誤り訂正能力は,統合前の文法誤り訂正モデルと同程度であり,意味構造学習モデルを付加することによる明白な改善は見られなかった.第4の課題について,第二言語学習者が英文を入力すると,提案した文法誤り訂正モデルにより文法誤りを指摘し,同時に,Wordnetデータベースから単語の概念と同義語を表示するアプリケーションを開発した.この成果は,第二言語学習者の支援に寄与するものである.
|
Report
(3 results)
Research Products
(1 results)