Research Abstract |
〈本研究の目的〉 日本の小学校,中学校,高等学校における教科書,及びコミック誌に出現する単語の種類とそれらの頻度を調査し,語彙表を作成する. 〈研究実施概要〉 1) 小学校・中学校における国語科の教科書として,最も使用頻度が高い光村図書出版のものをテキスト・データとして使用した. 2) 本研究では,汎用的な語彙表の作成を目指し,既存の形態素解析システム(松本他,1996)を利用し,その辞書が言語資料に対して最適化されるように調整を試みた.このシステムに実装されている文法は,益岡・田窪(1992)に基づいており.学校文法に比べて記述的な妥当性が高いと考えられる.また,解析結果の出力も計算機を利用した集計に適していると考えられる. 3) 構文解析システムを利用して,全6学年分の小学校の国語教科書から形容詞の抽出を実施した.調査の結果,延べ語数3011語,異なり語数353語であった.イ形容詞とナ形容詞のいずれについても,第1学年から第5学年にかけて,延べ語数と異なり語数はともに増加し続けている.しかし,第6学年については,第5学年と同程度の語数での停滞か,むしろ僅かな減少が認められる. 4) 一般の辞書から抽出された形容詞は,イ形容詞1112語とナ形容詞3769語であった.イ形容詞に対してナ形容詞は極端に多い.これは外来語を含めて,ナ形容詞には借用の形容詞が多数存在するためと考えられる.そこで,ナ形容詞のうち外来語であると考えられるカタカナ表記の語を抽出したところ,228語であった.学年毎と全学年の累積において教科書の形容語彙が辞書の形容語彙に占める比率を求めたところ,イ形容詞とナ形容詞のいずれにおいても,各学年ごとの教科書において出現する形容詞の種類数は,最大でも辞書の10%未満であった.全学年分の教科書を累積した場合の形容語彙に着目しても12%であった.教科書においては,イ形容詞の種類数が多かったのに対して,辞書ではナ形容詞の種類数が多いことを考慮すると,小学校教科書に現れる形容語彙を「日本語の基本的な形容語彙」として想定することは,必ずしも適切ではないと考えられる.現在,中学校の国語教科書をコーパスとして同様の分析を実施している.高等学校の教科書,コミック誌の分析については引き続き検討が必要である.
|