2018 Fiscal Year Annual Research Report
日本語教育用テキスト解析ツールの開発と学習者向け誤用チェッカーへの展開
Project/Area Number |
15H03216
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
山本 和英 長岡技術科学大学, 工学研究科, 准教授 (40359708)
|
Co-Investigator(Kenkyū-buntansha) |
森 篤嗣 京都外国語大学, 外国語学部, 教授 (30407209)
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
茂木 俊伸 熊本大学, 大学院人文社会科学研究部(文), 准教授 (20392540)
建石 始 神戸女学院大学, 文学部, 教授 (70469568)
岩田 一成 聖心女子大学, 文学部, 准教授 (70509067)
内丸 裕佳子 岡山大学, 全学教育・学生支援機構, 准教授 (00550964)
金 愛蘭 広島大学, 教育学研究科, 准教授 (90466227)
東条 佳奈 目白大学, 社会学部, 専任講師 (20782220)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 自然言語処理 / 誤り訂正 |
Outline of Annual Research Achievements |
当該年度では日本語の格助詞誤り訂正について下記2項目の研究を行い、それぞれ学会発表を行った。 (1)学習者にとって最も間違えやすい格助詞を訂正対象とし,言語モデルを用いた格助詞誤り訂正システムを構築した。助詞誤りの中でも助詞の不足による誤りの割合が高いため,訂正手順に格助詞の補完操作を組み込むことで助詞不足の訂正に取り組んだ。NAIST 誤用コーパスでの訂正実験の結果,置換訂正に対して補完訂正の再現率が低いことが明らかになった。 (2)格助詞「が・を・に・で」を対象にした分類モデルによる訂正手法を提案した.CNN モデルとRNN モデルを構築し,RNN モデルでは言語モデル手法よりも正解率 (%) が 8.59 ポイント向上した.また,提案手法により改善された例を示し,訂正対象単語の周辺だけでなく文全体を考慮した訂正ができていることを確認した.2 つのドメインの異なるコーパスでの実験では,同じサイズでも学習者コーパスに近いコーパスで訓練させた方が高い性能を示したことから,性能の向上に貢献する訓練コーパスの選定が重要であることを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
日本語学習者の格助詞誤り訂正について、言語モデル(n-gram)と分類モデル(CNN,RNN)の二つのモデルを提案することができ、それぞれ学会発表を行った。これらの研究成果は当初の研究計画から考えて順調に進展していると考えている。
|
Strategy for Future Research Activity |
当該年度の研究では訂正対象が 4 種類の格助詞,誤りが文中に 1 つのみ,誤り箇所が既知という問題設定で実験を行なったが,実際には多くの種類の誤りがあり,また誤りは 1 文中に複数箇所存在する可能性が十分にあり,かつ誤り箇所も未知である.しかし,日本語文法誤り訂正に関する研究があまり進んでいない今,このような問題設定は今後の調査にとって現実的で有益であると考える.今回の知見を活かし,今後はさらに現実的な問題に取り組んでいきたい.なお,今回取り組んだ格助詞誤り訂正を Web で利用できるツールとして公開する予定である。
|
Research Products
(2 results)