• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Developing an Index to Measure of Text Coherence Using Natural Language Processing and Its Application to Prediction of Reading Test Difficulty

Research Project

Project/Area Number 20K00901
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 02100:Foreign language education-related
Research InstitutionWaseda University

Principal Investigator

岩下 智彦  早稲田大学, 日本語教育研究センター, その他(招聘研究員) (00803397)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2022: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2021: ¥130,000 (Direct Cost: ¥100,000、Indirect Cost: ¥30,000)
Fiscal Year 2020: ¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Keywords日本語教育 / 自然言語処理 / 読解 / 言語テスト / 単語ベクトル / 難易度予測 / 文生成 / 教育工学 / 文章の計算モデル / テスト項目の難易度予測 / 文章・談話 / 評価
Outline of Research at the Start

国境を越えた人の移動が一般化した現代において,外国語能力の評価への重要性は高まっているが,言語テスト開発に必要不可欠であるテスト項目の難易度予測に関する研究は少ない。特に読解については,言語形態的な指標や設問の種類と難易度との関連性が明らかにされているものの,1文を超える文章の一貫性という観点は,意味の推論を含む特性から考慮されてこなかった。本研究では,自然言語処理の技術を応用し,1)人が評定する文章の一貫性は,自然言語処理の技術を用いて定量的に表現することが可能か。2)文章の一貫性は,読解テストの難易度に影響を与えているのか。3)その影響は,設問の種類により異なるかという3点を明らかにする。

Outline of Annual Research Achievements

本年度における研究実績は以下の通りである。
1)研究機関を通して,最も難航してた言語モデルによるテキストの類似度の計算作業が完了した。使用する言語モデルと計算手法を組み合わせることで約50通りのテキストの類似度が算出できた。これらの値と専門家による評定の関連性を確認した。
2)調査対象としたテキストの結束性に焦点を当て,複数の言語特徴量の集計を行った。今後,これらの値と専門家による評定およびテキストの類似度との関連性を分析する予定である。
3)これまで調査したテストの読解文と異なるタイプのテキストに対しても類似度の指標が有効であるかを確認するため,異なるテキストデータを収集し,評定調査を実施した。すべての評定結果が収集され,現在,分析を行なっている。
4)自然言語処理技術への理解を深めるため、本研究でも利用するBERTを用いた文生成の実装を継続して行った。現在,使用する言語モデルおよび微調整の方法を検討中である。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

昨年度から引き続き,自然言語処理のプログラミングにおいて一定の時間が必要とされたため,計画の遅延が生じた。現在のとこ路,研究協力者の協力もあり,言語処理において必要な工程は概ね完了することができた。また,評定対象としたテキストの質的なバリエーションが少なく,対象とするテキストの拡大,および分析方法の検討を要した。現在,新たなテキストの評定調査が終了し,分析を進めている。

Strategy for Future Research Activity

現在,当初の計画に必要な調査および分析手法の実装がすべて完了し,順に分析を進めている。一定の成果がまとまった時点で年度内に論文として投稿する予定である。

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (2 results)

All 2023 2021

All Presentation (2 results) (of which Invited: 1 results)

  • [Presentation] 自然言語処理を用いた例文生成とその妥当性―日本語教師の支援を目的としたBERT・T5を用いた文生成シミュレーション―2023

    • Author(s)
      岩下智彦・吉原将大・浅川伸一
    • Organizer
      2023年度日本語教育学会春季大会
    • Related Report
      2022 Research-status Report
  • [Presentation] 日本語の文章において一貫性に影響を与える要因は何か ―日本語学習者向け読解テストの文章を対象とした重回帰モデルによる検討―2021

    • Author(s)
      岩下智彦・内海彰
    • Organizer
      こかげ研 ~コミュニケーション・感情・言語研究会~
    • Related Report
      2021 Research-status Report
    • Invited

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi