• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

日本語教育用テキスト解析ツールの開発と学習者向け誤用チェッカーへの展開

研究課題

研究課題/領域番号 15H03216
研究機関長岡技術科学大学

研究代表者

山本 和英  長岡技術科学大学, 工学研究科, 准教授 (40359708)

研究分担者 内丸 裕佳子  岡山大学, 全学教育・学生支援機構, 准教授 (00550964)
中俣 尚己  京都教育大学, 教育学部, 准教授 (00598518)
茂木 俊伸  熊本大学, 大学院人文社会科学研究部(文), 准教授 (20392540)
東条 佳奈  目白大学, 社会学部, 専任講師 (20782220)
森 篤嗣  京都外国語大学, 外国語学部, 教授 (30407209)
建石 始  神戸女学院大学, 文学部, 教授 (70469568)
岩田 一成  聖心女子大学, 文学部, 准教授 (70509067)
金 愛蘭  日本大学, 文理学部, 准教授 (90466227)
研究期間 (年度) 2015-04-01 – 2020-03-31
キーワード日本語誤り訂正
研究実績の概要

今年度は課題最終年度として、日本語文法誤り訂正のうち誤り種類を限定しない文法誤り訂正に取り組んだ。機械翻訳モデルを用いて誤り文を正しい文に “翻訳” することで様々な種類の誤りを訂正した文を生成する手法が主流となっているが、日本語作文における研究はまだ行われていない。そこでニューラル機械翻訳で強力なモデルである Transformer に、入力単語をコピーすることを学習するコピー機構を取り入れたモデルを用いて日本語学習者作文の文法誤り訂正を行う。モデルの訓練には大規模な学習者コーパスが必要となるが、利用できる学習者コーパスの規模は小さい。そこで大規模で容易に入手可能な日本語コーパスの正しい文に対して擬似的に誤りを発生させた擬似誤りコーパスを生成し、訓練データの拡張を行う。日本語特有の誤り傾向を考慮した擬似誤り生成手法を提案し先行研究の訂正性能を上回ることを確認した。擬似誤り生成と事前学習によって性能は大幅に向上することは明らかであるが、どのような擬似誤りが性能の向上に寄与するのかは英語においても未だに詳しく検証されていない。今後は文法誤り訂正のための擬似誤り生成手法の研究が活発になると考えられる。その中で、日本語において、直接的に誤り傾向や文法を考慮した擬似誤り生成手法を新たに提案したことは、このブルーオーシャンなテーマに一石を投じることができたのではないかと思う。
本研究で構築した文法誤り訂正システムをツールとしてウェブに公開した。残念ながら実用的な精度で訂正を行うことはできないが、現状の精度を確かめることはできるだろう。このツールが誰かの日本語文法誤り訂正に取り組むきっかけになることを期待している。

現在までの達成度 (段落)

令和元年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和元年度が最終年度であるため、記入しない。

  • 研究成果

    (2件)

すべて 2020 2019

すべて 学会発表 (2件) (うち国際学会 1件)

  • [学会発表] 日本語誤り訂正における擬似誤り生成による訓練データ拡張2020

    • 著者名/発表者名
      小川 耀一朗, 山本 和英
    • 学会等名
      言語処理学会第26回年次大会, pp.505-508 (2020.3)
  • [学会発表] Japanese Particle Error Correction employing Classification Model2019

    • 著者名/発表者名
      Youichiro Ogawa and Kazuhide Yamamoto
    • 学会等名
      Proceedings of the International Conference on Asian Language Processing (IALP 2019), pp.23-28 (2019.11)
    • 国際学会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi