2019 Fiscal Year Annual Research Report
日本語教育用テキスト解析ツールの開発と学習者向け誤用チェッカーへの展開
Project/Area Number |
15H03216
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
山本 和英 長岡技術科学大学, 工学研究科, 准教授 (40359708)
|
Co-Investigator(Kenkyū-buntansha) |
内丸 裕佳子 岡山大学, 全学教育・学生支援機構, 准教授 (00550964)
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
茂木 俊伸 熊本大学, 大学院人文社会科学研究部(文), 准教授 (20392540)
東条 佳奈 目白大学, 社会学部, 専任講師 (20782220)
森 篤嗣 京都外国語大学, 外国語学部, 教授 (30407209)
建石 始 神戸女学院大学, 文学部, 教授 (70469568)
岩田 一成 聖心女子大学, 文学部, 准教授 (70509067)
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 日本語誤り訂正 |
Outline of Annual Research Achievements |
今年度は課題最終年度として、日本語文法誤り訂正のうち誤り種類を限定しない文法誤り訂正に取り組んだ。機械翻訳モデルを用いて誤り文を正しい文に “翻訳” することで様々な種類の誤りを訂正した文を生成する手法が主流となっているが、日本語作文における研究はまだ行われていない。そこでニューラル機械翻訳で強力なモデルである Transformer に、入力単語をコピーすることを学習するコピー機構を取り入れたモデルを用いて日本語学習者作文の文法誤り訂正を行う。モデルの訓練には大規模な学習者コーパスが必要となるが、利用できる学習者コーパスの規模は小さい。そこで大規模で容易に入手可能な日本語コーパスの正しい文に対して擬似的に誤りを発生させた擬似誤りコーパスを生成し、訓練データの拡張を行う。日本語特有の誤り傾向を考慮した擬似誤り生成手法を提案し先行研究の訂正性能を上回ることを確認した。擬似誤り生成と事前学習によって性能は大幅に向上することは明らかであるが、どのような擬似誤りが性能の向上に寄与するのかは英語においても未だに詳しく検証されていない。今後は文法誤り訂正のための擬似誤り生成手法の研究が活発になると考えられる。その中で、日本語において、直接的に誤り傾向や文法を考慮した擬似誤り生成手法を新たに提案したことは、このブルーオーシャンなテーマに一石を投じることができたのではないかと思う。 本研究で構築した文法誤り訂正システムをツールとしてウェブに公開した。残念ながら実用的な精度で訂正を行うことはできないが、現状の精度を確かめることはできるだろう。このツールが誰かの日本語文法誤り訂正に取り組むきっかけになることを期待している。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|
Research Products
(2 results)