研究課題/領域番号 |
20K00901
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02100:外国語教育関連
|
研究機関 | 早稲田大学 |
研究代表者 |
岩下 智彦 早稲田大学, 日本語教育研究センター, その他(招聘研究員) (00803397)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2022年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2021年度: 130千円 (直接経費: 100千円、間接経費: 30千円)
2020年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
|
キーワード | 日本語教育 / 自然言語処理 / 読解 / 言語テスト / 単語ベクトル / 難易度予測 / 文生成 / 教育工学 / 文章の計算モデル / テスト項目の難易度予測 / 文章・談話 / 評価 |
研究開始時の研究の概要 |
国境を越えた人の移動が一般化した現代において,外国語能力の評価への重要性は高まっているが,言語テスト開発に必要不可欠であるテスト項目の難易度予測に関する研究は少ない。特に読解については,言語形態的な指標や設問の種類と難易度との関連性が明らかにされているものの,1文を超える文章の一貫性という観点は,意味の推論を含む特性から考慮されてこなかった。本研究では,自然言語処理の技術を応用し,1)人が評定する文章の一貫性は,自然言語処理の技術を用いて定量的に表現することが可能か。2)文章の一貫性は,読解テストの難易度に影響を与えているのか。3)その影響は,設問の種類により異なるかという3点を明らかにする。
|
研究実績の概要 |
本年度における研究実績は以下の通りです。 1)テスト項目に対する評定において、一部、評定者間で認識が異なっている評定項目があることが明らかになった。そのため、改めて各評定者に対して説明を行った上で、該当する評定の一部に対して再評定を依頼し、その結果の収集と整形作業が終了した。 2)文章に対する言語統計値の集計を行った。各文章の言語特徴量や語彙レベルなど数量化可能な情報の集計を行い、各文章の言語特徴量の観点による特徴を明らかにした。 3)文章とテスト項目難易度との関連性について検討するため、N-gramをはじめとした明示的な情報に着目した本文と選択肢のる重複率の算出を行った。その結果、文章とテスト項目との関連性について、明示的な情報に基づく関連性を示すことができた。 4)自然言語処理技術への理解を深めるため、本研究でも利用するBERTを用いた文生成の実装を行った。BERTを用いて日本語教育向けの例文生成を行い、その生成文の評定結果を集計した。その結果、全評定データの6割以上に対して正しい文という評定がされていることが明らかになった。これにより、自然言語処理技術の日本語教育への応用可能性について、新たな視点を提供した。 5)自然言語処理を用いた一貫性の数値化に関する先行研究および読解テストの難易度予測に関する先行研究の調査を行った。これにより、本研究が日本語教育分野と自然言語処理分野の両方に位置づけられることを明確にし、これら二つの分野が交差する領域において、新たな知見を提供できる可能性を示しました。上記、4)については、日本語教育学会春季大会において、その成果を発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究は、読解問題の文章に対して人手による評定を行った結果を対象とした研究とその文章を機械的に処理し、自然言語処理の技術を応用する研究に分けられる。前者に関しては昨年度、予定通り研究成果をまとめたが、後者に関しては、主にプログラムによる処理の方法と手法の検討を行った。プログラムを用いた機械処理については、新たに習得すべき点が多く、時間がかかっているため、研究作業全体の進捗に遅延が生じた。
|
今後の研究の推進方策 |
本年度までの実績により、本研究の目的1)人が評定する文章の一貫性は,自然言語処理の技術を用いて定量的に表現することが可能か。に関しては部分的な結果が得られた。昨年度までの成果に加えて、言語統計の観点も加えた、より精緻な検証を行う予定である。 今後は研究計画に従い、研究目的2)文章の一貫性は,読解テストの難易度に影響を与えているのか。および3)その影響は,設問の種類により異なるかという点について、分析作業を進め、成果を報告する予定である。
|