発達段階と到達目標を考慮した学齢別漢字重要度評価法の開発
Project/Area Number |
16H00011
|
Research Category |
Grant-in-Aid for Encouragement of Scientists
|
Allocation Type | Single-year Grants |
Research Field |
国語・国文学
|
Research Institution | 文部科学省 |
Principal Investigator |
今田 水穂 文部科学省, 初等中等教育局, 教科書調査官
|
Project Period (FY) |
2016
|
Project Status |
Completed (Fiscal Year 2016)
|
Budget Amount *help |
¥540,000 (Direct Cost: ¥540,000)
Fiscal Year 2016: ¥540,000 (Direct Cost: ¥540,000)
|
Keywords | コーパス言語学 / 作文教育 / 漢字教育 |
Outline of Annual Research Achievements |
『現代日本語書き言葉均衡コーパス』(BCCWJ)と『児童・生徒作文コーパス』という2種類の言語資源を用いて、児童の書き言葉における潜在的な漢字需要を評価した。まず、作文コーパスに対して形態論情報を人手付与し、児童の使用する語彙と頻度を調べた。次に、BCCWJを漢字習得後の漢字使用モデルと仮定して、各語における各漢字使用頻度を求めた。この2種類のデータを統合することにより、児童の潜在的な(成人と同水準で漢字を使用した場合の)漢字使用頻度を試算した。具体的には、文書yにおける語xの頻度をf(x, y)、文書z、語yにおける文字xの頻度をg(x, y, z)とし、文書aの漢字使用頻度が文書b並みになった場合の文字cの頻度をe(c, a, b)=¥sum_w{f(w, a)×g(c, w, b)/f(w, b)}として計算した。その結果、推定される児童の漢字使用頻度は100万字あたり20~23万字で学年が上がるにつれて増加すること、抽象語彙に含まれる漢字が増加する一方で作文テーマと直結するような特徴語に含まれる漢字は相対的に減少すること、「僕」「違」「頃」など配当外だがよく使われる漢字がある一方で、「汽」「麦」など低学年に配当されているがほとんど使われない漢字があることなどを確認した。一方で、児童作文には著者の属性、文種、作文テーマなどの影響と考えられる高頻度漢字が多く見られ、資料の代表性の担保の面で課題が残った。作成した推定漢字頻度表は、解説文書を付した上で、近日中に関連URLで公開する予定である。本研究は、特徴の異なる2種類の言語資源を組み合わせることによって、単一の資料では調査困難な課題を創発的に解決する手法を提案するものであり、今後期待される日本語コーパスのより高度な利活用手法の開発に寄与するものとして意義と重要性を持つ。
|
Report
(1 results)
Research Products
(2 results)