研究課題/領域番号 |
18K00771
|
研究機関 | 西南学院大学 |
研究代表者 |
杉山 香織 西南学院大学, 文学部, 准教授 (00735970)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 語彙知識 / リーディング / 読解 / 未知語 / CEFR |
研究実績の概要 |
本年度の目的は,前年度作成した受容語彙知識予測モデルにCEFRのガイドラインを変数として加え,精緻化することである。また,精緻化したモデルを使用し,学習者の読解得点を予測することが可能かどうかを検証することである。 前年度作成した既知語と未知語を予測するモデルは,フランス語学習者の受容語彙知識を一定の水準で正しく予測できることを明らかにした。しかし,モデル作成に使用したデータは限られた学習者のものである点や,調査した単語数も少ない点が課題として残った。またモデル作成に使用した変数も,VocabProfil とFLELex による頻度情報のみであったため,精緻化するためには別の変数を加える必要があった。 そこで,本年度は異なるテキストを使用し,異なる学習者を対象に予測モデルを適用した。その結果,未知語に関してはある程度高い水準で正しく予測することができたため,未知語予測には有効であるといえる。しかし,いずれも前年度使用したデータの一致率よりも低かった。新たに,CEFRのガイドラインを変数として加えたところ,予測エラーの一部を修正することができた。また,CEFRのガイドラインに基づく語彙知識予測モデルは,いずれも前年度の語彙知識予測モデルよりも正しく予測することができた。 語彙知識予測モデルを使用した読解得点の予測に関しては,読解得点の合否左右するのは「既知語予測∧Aレベル」と「未知語予測∧Aレベル」の既知語の割合であることが明らかになった。それぞれ既知語の割合と読解得点の相関を調べたところ強い相関がみられたが,特に「既知語予測∧Aレベル」の既知語の割合との相関が高く(r=.89),合格点に達したグループと達しなかったグループで既知語の割合に隔たりが確認できたことから,「既知語予測∧Aレベル」の既知語の割合を用いて読解セクションの合否を予測することは可能であると言える。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データ収集の進捗状況についてはおおむね順調である。調査に使用したテキストの難易度が高く,タスクの量も多いため,調査者を限定せざるをえなくなったが,本年度までにのべ63名分のデータを集めることができた。 分析面に関してもおおむね順調に進展している。昨年度作成した学習者の語彙知識予測モデルについて,データを加えて多角的に検証し,エラーを割り出した。そして,新たな変数を加えることでモデルを精緻化することができた。 一方,新型コロナウイルス感染拡大により,当初予定していた研究会の開催がかなわず,研究成果を公開する機会が少なかった。
|
今後の研究の推進方策 |
2021年度は最終年度となるため,語彙知識予測モデルの完成を目指す。2020年度までに作成した受容語彙知識(既知語と未知語)予測するモデルについて,新たなデータを用いて検証を重ね,信頼性を補強する。 また,語彙知識予測モデルによる判定エラーの傾向として,英語の語彙知識との関連が見られたため,フランス語の語彙知識と英語の語彙知識の関係をさらに詳細に調査する必要がある。特に,フランス語の単語と同形のものや類似した形を持つものについては,英語における語彙頻度やCEFRレベルも考慮に入れなければならない。 さらに,国際ワークショップの開催や,報告書の刊行を通して,本研究の成果を発表していく。これまでの分析から,本研究において自動言語処理的観点からの研究の重要性が確認できたため,その技術を取り入れてリーダビリティ研究を行う研究者を国際ワークショップに招待し,本研究の成果を共有するとともに,さらなる研究の発展に向けた検討を行う。
|
次年度使用額が生じた理由 |
新型コロナウイルスの蔓延により,当初予定していた調査,ワークショップの開催,出版物の刊行ができなかったため。
|